Core Concepts
추천 시스템 모델은 과거 피드백에서 사용자 선호도를 포착하고 후보 항목에 대한 사용자별 피드백을 예측하려 하지만, 다양한 측정되지 않은 혼란 요인으로 인해 과거 피드백의 사용자 선호도와 진정한 선호도 사이에 편차가 발생하여 모델 성능이 기대에 미치지 못한다. 본 연구는 이전 추천 시스템의 영향을 고려하고 잠재적 혼란 요인을 분리하여 사용자의 진정한 선호도를 포착하는 새로운 프레임워크를 제안한다.
Abstract
본 연구는 추천 시스템에서 발생하는 편향 문제를 해결하기 위해 잠재적 혼란 요인을 분리하고 학습하는 새로운 프레임워크를 제안한다.
추천 시스템 모델은 과거 피드백에서 사용자 선호도를 포착하고 후보 항목에 대한 사용자별 피드백을 예측하려 하지만, 다양한 측정되지 않은 혼란 요인으로 인해 과거 피드백의 사용자 선호도와 진정한 선호도 사이에 편차가 발생한다.
기존 편향 해소 모델은 (1) 특정 편향 문제를 해결하거나 (2) 사용자 과거 피드백에서 보조 정보를 직접 얻는데, 이는 학습된 선호도가 진정한 사용자 선호도인지 혼란 요인과 혼합된 것인지 식별할 수 없다.
본 연구는 이전 추천 시스템의 영향을 고려하고 이를 모든 측정되지 않은 혼란 요인의 대리변수로 활용한다.
잠재적 혼란 요인을 분리하고 학습하는 새로운 프레임워크 SLFR을 제안한다. SLFR은 사용자 선호도와 측정되지 않은 혼란 요인을 분리하여 진정한 사용자 선호도를 포착한다.
5개의 실제 데이터셋에 대한 실험 결과, SLFR이 다른 기법들에 비해 우수한 성능을 보였다.
Stats
사용자 선호도와 실제 선호도 사이의 편차가 크다는 것을 보여주는 데이터:
"Reasoner 데이터셋에서 음수 피드백의 94%가 실제로는 긍정적 선호도를 가지고 있었고, 긍정 피드백의 38.9%도 실제로는 부정적 선호도를 가지고 있었다."
"Kuairec 데이터셋과 비교했을 때, Reasoner 데이터셋의 긍정 피드백 비율이 훨씬 더 높았다."