Tracking Algorithm

테마 트래킹 알고리즘

TLI(Theme Lifecycle Index) 점수 산출 과정을 완전히 공개합니다

TLI란?

Theme Lifecycle Index

TLI는 한국 주식시장 테마의 생명주기를 정량화한 지수입니다. 검색 관심도, 뉴스 모멘텀, 변동성, 활동성 4개 요소를 가중 합산하여 0~100 사이의 점수를 산출하고, 이를 바탕으로 테마의 생명주기 단계를 판정합니다. 모든 데이터는 공개 소스에서 수집되며, 산출 과정을 투명하게 공개합니다.

4요소 점수 산출

각 요소의 가중치와 산출 방식

검색 관심

40%

데이터 소스

네이버 DataLab 검색량

산출 방식

최근 7일 평균 vs 30일 기준선 비교. 배치 내 자기 정규화 적용.

뉴스 모멘텀

35%

데이터 소스

네이버 뉴스 기사 수

산출 방식

이번 주 기사 수 vs 지난 주 기사 수 증감률 기반 산출.

변동성

10%

데이터 소스

관심도 시계열 표준편차

산출 방식

관심도 변동 폭을 측정하여 테마의 안정성을 평가.

활동성

15%

데이터 소스

네이버 증권 주가/거래량

산출 방식

관련주 가격 변동률, 거래량 강도, 데이터 커버리지 교차 시그널.

최종 점수 = (관심도 × 0.40) + (뉴스 모멘텀 × 0.35) + (변동성 × 0.10) + (활동성 × 0.15)

생명주기 5단계 + 재점화

점수와 추세 기반 단계 판정

초기

Emerging

새로운 테마가 관심을 받기 시작하는 단계입니다. 검색량이 기준선 대비 상승하기 시작하며, 뉴스 기사가 나타나기 시작합니다.

관심도 상승 초기 + 뉴스 모멘텀 양(+)

성장

Growth

관심이 빠르게 증가하는 성장 단계입니다. 검색량과 뉴스가 지속 증가하며, 관련주 거래량도 함께 늘어납니다.

관심도 가속 상승 + 높은 뉴스 모멘텀

정점

Peak

관심이 최고조에 달한 정점 단계입니다. 검색량이 피크에 도달했으며, 과열 신호에 주의가 필요합니다.

관심도 정점 근처 + 모멘텀 둔화 시작

하락

Decline

관심이 감소하고 있는 하락 단계입니다. 검색량과 뉴스 빈도가 줄어들고 있습니다.

관심도 하락 추세 + 뉴스 모멘텀 음(-)

휴면

Dormant

관심이 거의 없는 휴면 단계입니다. 품질 게이트 기준 미달로 목록에서 제외됩니다.

점수 50 미만 또는 신뢰도 low

재점화

Reigniting

하락 후 다시 관심이 증가하는 재점화 테마입니다. 과거 Decline/Dormant 이력이 있으면서 다시 성장세를 보입니다.

Decline/Dormant 이력 + 현재 관심도 재상승

유사 테마 비교

3-Pillar 유사도 분석

Feature Similarity (Mutual Rank)

두 테마의 점수 구성 요소(관심도, 뉴스, 변동성, 활동성)를 비교하여 특성 프로필이 얼마나 유사한지 측정합니다. 상호 순위 기반으로 비대칭적 유사성도 포착합니다.

Curve Similarity (RMSE + Pearson)

두 테마의 관심도 시계열 곡선 형태를 비교합니다. RMSE로 절대 거리를, 피어슨 상관계수로 추세 방향 유사성을 측정하며, 최소 14일 이상의 데이터가 필요합니다.

Keyword Similarity

두 테마의 키워드 구성을 비교하여 주제적 유사성을 측정합니다. 공통 키워드 비율과 키워드 가중치를 고려합니다.

유사도 임계값은 자동 튜닝됩니다. 검증 데이터가 축적될수록 정확도가 높았던 비교의 특성을 학습하여 임계값을 조정합니다. 현재 기본 임계값은 0.40입니다.

7일 전망 · 3-Phase 분석

생명주기 단계를 3개 방향으로 요약하여 1주일 전망 제공

5개 생명주기 단계를 투자 판단에 직결되는 3개 방향(Phase)으로 그룹핑하여 향후 7일간의 전망을 제공합니다.

상승 Rising

Emerging + Growth

관심이 증가하는 구간. 가장 신뢰도가 높은 시그널입니다.

과열 Hot

Peak

관심이 정점에 달한 구간. 하락 전환 가능성에 주의가 필요합니다.

냉각 Cooling

Decline + Dormant

관심이 감소하는 구간. 참고 수준의 시그널로 활용하세요.

전망 정확도는 Phase별로 차이가 있습니다. 상승(Rising) 시그널이 가장 높은 정확도를 보이며, 냉각(Cooling)은 참고 수준입니다. 시스템의 예측 가능 지평은 약 3~7일이며, 이를 넘어서는 전망은 신뢰도가 크게 떨어집니다.

데이터 소스 & 한계

투명하게 공개하는 데이터 출처와 한계점

네이버 DataLab

키워드별 검색 관심도 (상대값)

네이버 뉴스

테마 관련 기사 수 및 모멘텀

네이버 증권

관련주 주가, 거래량, 시가총액

알려진 한계

  • 네이버 DataLab은 배치당 5개 키워드 제한으로, 배치 간 상대값 차이를 자기 정규화로 보정합니다. 정밀도에 한계가 있습니다.

  • 7일 전망의 방향 예측 정확도는 약 55% 수준입니다. 특히 상승(Rising) 시그널의 정확도가 가장 높고, 냉각(Cooling) 시그널은 참고 수준입니다.

  • 뉴스 모멘텀은 기사 수 기반이며, 기사의 긍정/부정 감성은 분석하지 않습니다.

  • 데이터 수집 주기에 따라 최신 시장 변화가 즉시 반영되지 않을 수 있습니다.

투자 유의사항

본 알고리즘과 산출 결과는 정보 제공 목적이며, 투자 자문이나 권유가 아닙니다. 높은 점수가 투자 적기를 의미하지 않으며, 오히려 과열 신호일 수 있습니다. 투자 판단은 본인의 책임 하에 신중히 결정하시기 바랍니다.