核心概念
기존 교차 도메인 순차 추천 시스템의 겹치는 사용자 데이터에 대한 의존성을 줄이고, 겹치지 않는 사용자 데이터의 잠재력을 활용하여 추천 성능을 향상시키는 새로운 프레임워크를 제시한다.
摘要
연구 목표
본 연구는 겹치는 사용자 데이터에 의존하는 기존 교차 도메인 순차 추천 시스템의 한계를 극복하고, 겹치지 않는 사용자 데이터를 활용하여 추천 성능을 향상시키는 것을 목표로 한다.
방법
본 연구에서는 신경 프로세스(NP)를 기반으로 하는 새로운 교차 도메인 순차 추천 프레임워크인 CDSRNP를 제안한다. CDSRNP는 메타 학습 방식을 통해 겹치는 사용자 데이터를 지원 세트로 활용하여 쿼리 사용자(겹치는 사용자 또는 겹치지 않는 사용자)에 대한 예측을 수행한다.
CDSRNP의 주요 특징
- NP 기반 프레임워크: 지원 세트와 쿼리 세트 간의 교차 도메인 상관관계 사전/사후 분포를 정렬하여 쿼리 사용자(예: 겹치지 않는 사용자)의 행동 시퀀스가 다른 도메인 항목과 직접 연결될 수 있도록 한다.
- 세분화된 관심 적응 레이어: 개인화된 관련 지원 사용자의 관심사를 식별하여 쿼리 사용자 예측을 개선하기 위해 유익한 정보를 전달한다.
주요 결과
본 연구에서는 두 개의 실제 데이터 세트(Cloth-Sport, Phone-Elec)를 사용하여 CDSRNP의 성능을 평가하였다. 실험 결과, CDSRNP는 기존 방법들보다 우수한 성능을 보였으며, 특히 겹치지 않는 사용자 비율이 높은 시나리오에서 더욱 효과적인 것으로 나타났다.
결론
본 연구에서 제안된 CDSRNP는 겹치지 않는 사용자 데이터의 잠재력을 활용하여 교차 도메인 순차 추천 시스템의 성능을 향상시킬 수 있는 새로운 프레임워크를 제시한다.
연구의 중요성
본 연구는 겹치지 않는 사용자 데이터를 활용하여 추천 시스템의 성능을 향상시킬 수 있는 새로운 가능성을 제시한다. 이는 데이터 부족 문제를 완화하고 보다 포괄적인 사용자 모델링을 가능하게 하여 추천 시스템 분야에 기여할 수 있다.
한계점 및 향후 연구 방향
본 연구에서는 두 개의 도메인만을 고려하였으며, 향후 연구에서는 여러 도메인으로 확장하여 모델의 성능을 평가할 필요가 있다. 또한, 좀 더 다양한 유형의 데이터를 활용하여 모델의 일반화 성능을 향상시키는 연구도 필요하다.
统计
아마존 데이터셋에서 추출한 Cloth-Sport, Phone-Elec 두 가지 교차 도메인 시나리오 사용
Cloth-Sport 데이터셋: 겹치는 사용자 16,337명, 평균 상호작용 길이 4.39
Phone-Elec 데이터셋: 겹치는 사용자 7,857명, 평균 상호작용 길이 4.53
겹치지 않는 사용자 비율 K𝑢를 25%와 75%로 설정하여 실험
임베딩 차원 128, 부정 샘플링 비율 훈련 1, 검증 199, 테스트 999
학습률 Cloth-Sport 데이터셋 2e-5, Phone-Elec 데이터셋 1e-5
모델 학습 횟수 50회, 상호작용 시퀀스 길이 [15, 25, 35, 45]에서 변화
지원 세트 크기 [10, 20, 30, 40]에서 변화, 쿼리 세트 크기 20 (긍정 샘플 10개, 부정 샘플 10개)
引用
"However, intuitively, such a suggestion is biased, and the insufficient learning paradigm in non-overlapped users will inevitably limit model performance."
"Considering such a phenomenon, we raise a challenging and unexplored question: How to unleash the potential of non-overlapped user’s behaviors to empower CDSR?"