Core Concepts
온라인 플랫폼의 콘텐츠 조절 조치 이후 사용자 이탈을 사전에 예측할 수 있는 모델 개발
Abstract
이 연구는 온라인 플랫폼의 콘텐츠 조절 조치 이후 사용자의 이탈 행동을 예측하는 새로운 과제를 다룹니다.
데이터 준비 단계에서는 레딧에서 대규모 금지 조치가 있었던 15개 커뮤니티의 사용자 데이터를 수집하고 정제했습니다. 이 데이터를 활용하여 사용자의 활동, 유해성, 작문 스타일, 관계 특성 등 142개의 다양한 특징을 추출했습니다.
모델 최적화 및 학습 단계에서는 다양한 기계학습 알고리즘을 활용하여 사용자의 이탈 여부를 예측하는 이진 분류 모델을 개발했습니다. 이때 특징 선택, 데이터 균형화, 하이퍼파라미터 튜닝 등의 기법을 적용했습니다.
최종 평가 결과, 가장 우수한 모델이 마이크로 F1 점수 0.800, 매크로 F1 점수 0.676을 달성했습니다. 이는 사용자 이탈 예측이 가능함을 보여줍니다. 특히 사용자의 활동 특징이 가장 유용한 예측 요인으로 나타났으며, 관계 및 유해성 특징도 중요한 것으로 확인되었습니다.
이 연구 결과는 온라인 플랫폼 운영자들이 콘텐츠 조절 조치의 효과를 사전에 예측하고 전략적으로 대응할 수 있는 새로운 기회를 제공합니다. 이를 통해 건강한 온라인 환경 조성을 위한 보다 효과적인 콘텐츠 관리가 가능할 것으로 기대됩니다.
Stats
금지 조치 이후 사용자의 15.6%가 레딧을 완전히 떠났다.
금지 조치 이후 일부 사용자의 유해성이 크게 증가했다.
금지 조치 이후 대부분의 사용자들은 활동 수준이 감소했다.
Quotes
"현재의 콘텐츠 조절 전략은 시행착오 접근법을 따르고 있어, 조절 조치의 효과를 사전에 평가할 수 있다면 보다 전략적인 대응이 가능할 것이다."
"사용자 수준의 반응은 커뮤니티 수준의 반응과 다를 수 있어, 사용자 수준의 예측이 중요하다."
"사용자 이탈은 플랫폼 수익에 부정적 영향을 미치므로, 이를 예측하는 것은 실용적으로도 매우 중요하다."