Core Concepts
제한된 선호도 비교 데이터로도 아이템들이 저차원 부공간 구조를 가지고 있다면 메트릭을 학습할 수 있다. 이를 위해 부공간 메트릭을 개별적으로 학습한 뒤 이를 조합하여 전체 메트릭을 복원할 수 있다.
Abstract
이 논문은 제한된 선호도 비교 데이터로부터 알 수 없는 마하라노비스 거리 메트릭을 학습하는 방법을 제안한다.
먼저, 아이템들이 일반적인 위치에 있다면 사용자당 d개 미만의 선호도 비교 데이터로는 메트릭을 전혀 학습할 수 없음을 보인다.
그러나 아이템들이 저차원 부공간 구조를 가지고 있다면, 각 부공간에 대한 메트릭을 개별적으로 학습한 뒤 이를 조합하여 전체 메트릭을 복원할 수 있다. 이를 위해 다음과 같은 접근법을 제안한다:
각 부공간에 대한 메트릭을 학습한다. 사용자당 부공간 차원 수 이상의 선호도 비교 데이터만 있으면 부공간 메트릭을 학습할 수 있다.
학습한 부공간 메트릭들을 조합하여 전체 메트릭을 복원한다. 이를 위해 선형 방정식을 풀어 전체 메트릭을 구한다.
이 접근법은 아이템들이 정확히 부공간에 있지 않고 근사적으로 부공간 구조를 가지고 있는 경우에도 잘 작동함을 실험적으로 보인다.
Stats
아이템 x와 x'에 대한 선호도 비교 데이터 ψ(x, x'; u) = ∥x - u∥2
M - ∥x' - u∥2
M는 사용자 u의 이상점 u에 대한 상대적 선호도를 나타낸다.