Core Concepts
자기지도 추천 모델은 훈련 데이터의 허위 상관관계에 취약하여 일반화 능력이 낮다. 이를 해결하기 위해 다중 환경에서 불변 특징을 학습하고 허위 특징을 제거하는 방법을 제안한다.
Abstract
최근 자기지도 학습(SSL)이 추천 시스템에서 큰 성공을 거두고 있다. 그러나 SSL 기반 추천 모델은 훈련 데이터의 허위 상관관계에 취약하여 일반화 능력이 낮다. 이를 해결하기 위해 기존 연구는 ID 기반 SSL 추천이나 특징 공학을 활용하지만, 전자는 불변 특징의 긍정적인 영향을 포기하고 후자는 고비용 인간 레이블링이 필요하다.
이 문제를 해결하기 위해 본 연구는 자동으로 허위 상관관계를 완화하는 것을 목표로 한다. 이를 위해 1) 감독 없이 허위 특징을 자동으로 마스킹하고, 2) SSL 과정에서 허위 특징의 부정적인 영향 전파를 차단해야 한다.
이를 위해 본 연구는 불변 특징 학습 프레임워크(IFL)를 제안한다. IFL은 먼저 사용자-아이템 상호작용을 다중 환경으로 나누고, 환경 간 분포 변화를 활용하여 불변 특징을 포착하는 마스킹 메커니즘을 학습한다. 이 마스킹 메커니즘을 기반으로 IFL은 허위 특징을 제거하고 마스크 기반 데이터 증강을 통해 부정적인 영향 전파를 차단한다.
두 공개 데이터셋에 대한 실험 결과, IFL이 허위 상관관계를 완화하고 SSL 모델의 일반화 능력을 향상시키는 것을 확인했다.
Stats
사용자의 4년 및 6년 경력은 정규직 일자리와 강한 상관관계를 보이지만, 5년 및 7년 경력은 그렇지 않다.
사용자의 오스트리아 일자리에 대한 선호도는 현재 직장 경력에 크게 영향을 받는다.
Quotes
"사용자의 4년 및 6년 경력은 정규직 일자리와 강한 상관관계를 보이지만, 5년 및 7년 경력은 그렇지 않다."
"사용자의 오스트리아 일자리에 대한 선호도는 현재 직장 경력에 크게 영향을 받는다."