Core Concepts
사용자의 관심사는 지식 그래프 내 다양한 개념들의 조합으로 표현될 수 있으며, 이를 박스 임베딩을 통해 모델링함으로써 추천 성능을 향상시킬 수 있다.
Abstract
이 논문은 지식 그래프를 활용한 추천 시스템 모델 InBox를 제안한다. 기존 연구에서는 사용자의 관심사를 단일 포인트로 표현하여 관심사와 아이템 간의 관계를 정확히 모델링하지 못했다. 이에 반해 InBox는 사용자의 관심사를 다양한 개념들의 조합으로 표현하고, 이를 박스 임베딩으로 모델링한다.
구체적으로 InBox는 다음과 같은 3단계 학습 과정을 거친다:
- 기본 사전 학습 단계: 지식 그래프 내 개체와 관계를 각각 포인트와 박스로 표현하고, 이를 최적화한다.
- 박스 교차 단계: 각 아이템과 관련된 개념 박스들의 교차 영역을 계산하여 아이템을 해당 영역 내에 위치시킨다.
- 관심 박스 추천 단계: 사용자의 상호작용 내역을 바탕으로 관심 박스를 생성하고, 이를 활용하여 추천 점수를 계산한다.
실험 결과, InBox는 다양한 데이터셋에서 기존 최신 모델들을 뛰어넘는 성능을 보였다. 또한 모델 분석을 통해 지식 그래프 내 다양한 트리플릿 유형이 추천 성능에 미치는 영향을 확인할 수 있었다.
Stats
사용자와 아이템 간 상호작용 수: 3,034,796 (Last-FM), 1,185,068 (Yelp2018), 1,781,093 (Alibaba-iFashion), 847,733 (Amazon-book)
지식 그래프 내 IRI 트리플릿 비율: 0.71% (Last-FM), 0.00% (Yelp2018), 0.00% (Alibaba-iFashion), 0.12% (Amazon-book)
지식 그래프 내 TRT 트리플릿 비율: 24.44% (Last-FM), 53.09% (Yelp2018), 62.22% (Alibaba-iFashion), 73.04% (Amazon-book)
지식 그래프 내 IRT 트리플릿 비율: 74.85% (Last-FM), 46.91% (Yelp2018), 37.78% (Alibaba-iFashion), 26.84% (Amazon-book)
Quotes
"사용자의 관심사는 잠재적으로 많은 관련 아이템들의 집합을 포함한다."
"기존 모델들은 지식 그래프 정보와 관심사 연결성을 세부적으로 활용하지 못한다."
"InBox는 아이템, 태그, 관계를 각각 포인트와 박스로 표현하여 관심사와 개념 조합을 모델링한다."