Core Concepts
추천 시스템에서 새로운 사용자와 아이템을 효과적으로 처리하는 방법을 제안한다.
Abstract
이 논문은 추천 시스템에서 새로운 사용자와 아이템(Out-of-Vocabulary, OOV)을 효과적으로 처리하는 방법을 제안한다.
추천 시스템 연구에서는 주로 transductive 설정에 초점을 맞추지만, 실제 산업 환경에서는 새로운 사용자와 아이템이 지속적으로 등장하는 inductive 설정이 더 중요하다. 기존 연구에서는 OOV 처리가 주요 관심사가 아니었기 때문에, 실제 산업에서는 단순한 랜덤 버킷 할당 등의 방법을 사용하고 있다.
이 논문에서는 OOV 사용자와 아이템을 효과적으로 처리하기 위해 다양한 OOV 임베딩 방법을 제안한다. 이 방법들은 효율성, 기존 모델 성능 유지, 모델 독립성 등의 기준을 만족한다.
실험 결과, 특징 기반 Locality-Sensitive Hashing(LSH) 방법이 다른 방법들에 비해 대부분의 모델-데이터셋 조합에서 우수한 성능을 보였다. 특히 최고 성능 방법은 산업 표준 방법 대비 3.74%의 평균 향상을 보였다.
또한 실험을 위해 기존 공개 데이터셋을 시간 기반으로 분할하여 inductive 설정을 만들었고, 대규모 산업 데이터셋도 활용하였다. 이를 통해 실제 추천 시스템 환경에 부합하는 실험 환경을 구축하였다.
Stats
새로운 사용자와 아이템이 지속적으로 등장하는 inductive 설정이 실제 산업 환경에서 더 중요하다.
기존 연구에서는 OOV 처리가 주요 관심사가 아니었기 때문에, 실제 산업에서는 단순한 랜덤 버킷 할당 등의 방법을 사용하고 있다.
제안한 특징 기반 LSH 방법이 다른 방법들에 비해 대부분의 모델-데이터셋 조합에서 우수한 성능을 보였다.
최고 성능 방법은 산업 표준 방법 대비 3.74%의 평균 향상을 보였다.
Quotes
"추천 시스템 연구에서는 주로 transductive 설정에 초점을 맞추지만, 실제 산업 환경에서는 새로운 사용자와 아이템이 지속적으로 등장하는 inductive 설정이 더 중요하다."
"기존 연구에서는 OOV 처리가 주요 관심사가 아니었기 때문에, 실제 산업에서는 단순한 랜덤 버킷 할당 등의 방법을 사용하고 있다."
"제안한 특징 기반 LSH 방법이 다른 방법들에 비해 대부분의 모델-데이터셋 조합에서 우수한 성능을 보였다."