Core Concepts
사용자의 다양한 선호도를 고려하여 시청 시간을 최대화하는 협력적 다중 에이전트 기반 추천 시스템
Abstract
이 논문은 단편 동영상 추천 시스템에서 사용자의 다양한 선호도를 고려하여 시청 시간을 최대화하는 협력적 다중 에이전트 기반 추천 시스템을 제안한다.
주요 내용은 다음과 같다:
사용자의 시청 시간, 팔로우, 좋아요, 댓글 등 다양한 선호도 신호를 고려하는 다중 에이전트 협력 프레임워크를 제안했다. 각 에이전트는 특정 선호도 신호를 최대화하도록 학습되며, 이들이 협력하여 전체 사용자 만족도를 향상시킨다.
샘플 선택 편향 문제를 해결하기 위해 비노출 샘플을 활용하고 사용자 피드백 시뮬레이터를 도입하는 모델 기반 학습 접근법을 제안했다.
오프라인 실험과 온라인 A/B 테스트를 통해 제안 모델의 우수성을 검증했으며, 실제 대규모 동영상 플랫폼에 성공적으로 적용되었다.
Stats
사용자 한 세션 당 평균 시청 시간은 제안 모델이 기존 모델 대비 0.55% 향상되었다.
사용자 한 세션 당 평균 동영상 시청 개수는 제안 모델이 기존 모델 대비 0.54% 향상되었다.
사용자 한 세션 당 평균 팔로우 수는 제안 모델이 기존 모델 대비 1.45% 향상되었다.
사용자 한 세션 당 평균 댓글 수는 제안 모델이 기존 모델 대비 1.28% 향상되었다.
Quotes
"사용자의 다양한 선호도 신호를 고려하여 시청 시간을 최대화하는 협력적 다중 에이전트 기반 추천 시스템을 제안한다."
"샘플 선택 편향 문제를 해결하기 위해 비노출 샘플을 활용하고 사용자 피드백 시뮬레이터를 도입하는 모델 기반 학습 접근법을 제안한다."