본 연구 논문에서는 추천 에이전트와 사용자 에이전트를 동시에 개선하는 피드백 루프 프레임워크인 FLOW를 제안합니다.
기존의 대규모 언어 모델 기반 추천 시스템 연구는 추천 에이전트 또는 사용자 에이전트를 개별적으로 개선하는 데 중점을 두었지만, 두 에이전트 간의 상호 작용과 협업을 고려하지 않았습니다. 본 연구는 추천 시스템에서 사용자와 추천 시스템 간의 피드백 루프의 중요성을 강조하고, 이를 활용하여 추천 성능과 사용자 시뮬레이션 성능을 동시에 향상시키는 것을 목표로 합니다.
FLOW는 추천 에이전트, 사용자 에이전트, 두 에이전트 간의 피드백 루프로 구성됩니다. 추천 에이전트는 추천 모델을 사용하여 사용자-아이템 상호 작용 이력을 기반으로 아이템을 추천하고, 사용자 에이전트는 보상 모델을 사용하여 추천된 아이템을 평가하고 피드백을 제공합니다. 이러한 피드백 루프를 통해 추천 에이전트는 사용자의 선호도를 더 잘 이해하고, 사용자 에이전트는 사용자 행동을 더 정확하게 시뮬레이션할 수 있습니다.
세 가지 널리 사용되는 추천 데이터 세트(LastFM, Steam, MovieLens)에 대한 실험 결과, FLOW는 추천 성능과 사용자 시뮬레이션 성능을 모두 향상시키는 것으로 나타났습니다. 특히, 피드백 루프의 반복 횟수가 증가함에 따라 두 에이전트의 성능이 모두 향상되었으며, 추천 모델과 보상 모델을 동시에 사용할 때 가장 큰 성능 향상을 보였습니다.
본 연구는 추천 시스템에서 추천 에이전트와 사용자 에이전트 간의 피드백 루프를 활용하는 것의 중요성을 강조합니다. FLOW는 대규모 언어 모델 기반 추천 시스템의 성능을 향상시키는 데 효과적인 프레임워크이며, 향후 다양한 추천 시스템에 적용될 수 있을 것으로 기대됩니다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor