데이터 파이프라인
- 가격 데이터: 일별 시세를 DB에 저장하고 180일 윈도로 피처를 생성합니다.
- 피처 엔지니어링: 수익률, 변동성, 모멘텀, 거래량 비율 등을 계산합니다.
- 타깃: 다음 날 수익률을 예측 대상으로 사용합니다.
모델 앙상블
- CatBoost: 최신 피처 스냅샷을 이용하는 트리 기반 회귀 모델입니다.
- GRU: 시계열 패턴을 포착하기 위해 30일 길이의 시퀀스를 입력으로 받습니다.
- Transformer: 60일 시퀀스를 활용해 장기 패턴을 학습합니다.
- 가중 평균: 세 모델의 예측을 0.4 / 0.3 / 0.3 비율로 결합해 최종 점수를 계산합니다.
추천 산출 과정
- 최신 날짜의 피처를 불러와 세 모델로 스코어를 계산합니다.
- 앙상블 점수를 기준으로 종목을 랭킹하고 상위 10개를 추천 리스트로 제공합니다.
- 다음 거래일 고가가 집계되면 추천 기록에 수익률을 업데이트합니다.
주의 사항
본 모델은 과거 데이터에 기반한 통계적 예측 도구이며 미래 수익을 보장하지 않습니다. 투자 판단과 책임은 사용자에게 있습니다.