측정 방법론

커뮤니티연구소는 투명하고 재현 가능한 방법론을 추구합니다. 아래는 KI 지수가 산출되는 전체 과정을 설명합니다.

1. 지표 수집 (Data Collection)

KI 지수는 공개된 플랫폼 API와 웹 데이터를 통해 정량 지표를 수집합니다. 수집 대상은 카테고리별로 정의된 지표 유형(Metric Type)에 따라 결정됩니다.

크리에이터 카테고리의 경우 구독자 수, 총 조회수, 최근 영상 평균 조회수, 댓글 수, 좋아요 비율, 업로드 빈도 등이 수집됩니다.

수집은 주기적으로 수행되며, 각 수집 건에는 수집 날짜와 출처 정보가 함께 기록됩니다. 동일 엔티티의 동일 지표는 날짜별로 하나의 값만 저장됩니다.

2. 정규화 (Normalization)

수집된 원시 데이터는 지표마다 단위와 범위가 다르므로, 비교를 위해 정규화를 수행합니다. 커뮤니티연구소는 Min-Max 정규화 방식을 기본으로 사용합니다.

normalized = (value - min) / (max - min)

이를 통해 모든 지표 값이 0~1 사이로 변환되며, 서로 다른 지표 간 동일한 스케일에서 비교 및 가중 합산이 가능해집니다.

극단적인 이상치(outlier)가 있는 경우 로그 변환이나 분위수 기반 정규화를 보조적으로 적용할 수 있으며, 이 경우 해당 스냅샷 노트에 명시합니다.

3. 가중치 모델 (Weighting Model)

정규화된 지표들은 가중치 모델(Score Model)에 따라 가중 합산되어 최종 점수(Final Score)가 산출됩니다.

각 카테고리별로 독립적인 가중치 모델이 운영되며, 모델은 코드, 이름, 버전으로 식별됩니다. 가중치는 각 지표의 중요도를 반영하여 연구진이 설정합니다.

finalScore = sum(normalized_i * weight_i) for all metrics

최종 점수는 0~1 범위이며, 차트에서는 100을 곱하여 0~100점으로 표시합니다.

4. 스냅샷 (Snapshot)

점수가 산출되면 스냅샷(Snapshot)으로 발행됩니다. 스냅샷은 특정 시점의 전체 순위를 고정한 기록이며, 한번 발행되면 변경되지 않습니다.

각 스냅샷에는 날짜, 레이블, 상태(draft/published/archived) 정보가 포함되며, 스냅샷 아이템에는 각 엔티티의 순위, 점수, 이전 순위, 변동 폭이 기록됩니다.

발행된(published) 스냅샷만 공개 차트에 노출되며, 가장 최근 발행 스냅샷이 현재 차트로 표시됩니다.

5. 순위 변동 계산 (Movement)

새 스냅샷 발행 시, 직전 발행 스냅샷과 비교하여 순위 변동을 자동으로 계산합니다. 변동 유형은 다음 네 가지로 분류됩니다.

상승 (up)

이전 대비 순위가 올라간 경우

하락 (down)

이전 대비 순위가 내려간 경우

유지 (same)

이전과 동일한 순위인 경우

신규 (new)

이전 스냅샷에 없던 신규 진입

6. 한계 (Limitations)

  • 정량 데이터만 사용하므로, 콘텐츠 질이나 사회적 영향 등 정성적 요소는 반영되지 않습니다.
  • 플랫폼별 API 제한이나 데이터 제공 범위에 따라 수집 가능한 지표가 달라질 수 있습니다.
  • 가중치 모델 버전이 변경되면 이전 스냅샷과 직접적인 점수 비교가 어려울 수 있습니다.
  • 봇 트래픽, 광고 유입 등 인위적 지표 조작은 감지하기 어려우며, 이로 인한 왜곡이 있을 수 있습니다.
  • 측정 대상은 연구진이 선정하며, 모든 엔티티를 포괄하지 않습니다.