데이터 파이프라인
- 가격 데이터: 일별 시세를 DB에 저장하고 180일 히스토리로 피처를 구성합니다.
- 피처 엔지니어링: 1·3·5·10·20일 수익률, 변동성(5·10·20일), 이동평균 괴리, RSI, 거래량 비율/추세, 시장 대비 상대강도, 횡단면 랭크 등을 계산합니다.
- 타깃: 다음 날 수익률을 예측 대상으로 사용해 모델을 학습합니다.
모델 앙상블
- CatBoost: 최신 피처 스냅샷을 이용하는 트리 기반 회귀 모델입니다.
- GRU: 시계열 패턴을 포착하기 위해 30일 길이의 시퀀스를 입력으로 받습니다.
- Transformer: 60일 시퀀스를 활용해 장기 패턴을 학습합니다.
- 가중 평균: 세 모델의 예측을 0.4 / 0.3 / 0.3 비율로 결합하되, 품질 필터를 통과한 종목만 최종 랭킹에 반영합니다.
품질·리스크 스크리닝
- 과열 제거: 일간 수익률 12% 이상, 5일 수익률 35% 이상, RSI 75 이상, 20일 이동평균 대비 20% 이상乖離 등 과열 시그널을 가진 종목은 제외합니다.
- 유동성 체크: 최근 거래량이 20일 평균의 60% 미만이면 추천에서 배제합니다.
- 신호 제공: 추천된 종목마다 수익률·변동성·상대강도·RSI 등 주요 팩터 값을 함께 제공해 판단을 돕습니다.
추천 산출 과정
- 확장된 피처를 불러와 세 모델로 스코어를 계산합니다.
- 품질·유동성 필터로 과열 종목을 제거한 뒤 앙상블 점수로 랭킹합니다.
- 상위 10개를 추천하면서 각 종목의 핵심 팩터 신호를 함께 제공합니다.
- 다음 거래일 고가가 집계되면 추천 기록에 수익률을 업데이트합니다.
주의 사항
본 모델은 과거 데이터에 기반한 통계적 예측 도구이며 미래 수익을 보장하지 않습니다. 투자 판단과 책임은 사용자에게 있습니다.