Core Concepts
이산 의미 토큰화를 통해 사용자와 아이템 정보를 효율적으로 통합하여 실시간 CTR 예측 모델의 성능과 효율성을 향상시킬 수 있다.
Abstract
이 논문은 실시간 CTR 예측 모델에 아이템 콘텐츠 정보를 효과적으로 통합하는 방법을 제안한다. 기존의 접근법은 시간과 공간 효율성 사이의 균형을 잡는 데 어려움이 있었다.
제안하는 UIST(User-Item Semantic Tokenization) 프레임워크는 다음과 같은 특징을 가진다:
- 아이템과 사용자 정보를 이산 토큰으로 표현하여 공간 효율성을 크게 향상시킴 (약 200배 압축)
- 계층적 혼합 추론 모듈을 통해 다양한 수준의 토큰 정보를 효과적으로 통합
- 실험 결과, 제안 방법이 기존 접근법 대비 성능 저하 없이 훈련 및 추론 속도를 크게 향상시킴
이를 통해 실시간 추천 시스템에 적용 가능한 효율적인 CTR 예측 모델을 제공할 수 있다.
Stats
제안 방법은 약 200배의 공간 압축을 달성했다.
제안 방법의 AUC 성능은 기존 최신 방법 대비 최대 99%를 달성했다.
제안 방법의 추론 지연 시간은 기존 방법 대비 크게 향상되었다.
Quotes
"Incorporating item content information into CTR prediction models remains a challenge, especially with the time and space constraints of industrial scenarios."
"Our proposed IST and UIST achieve substantial memory compression (approximately 200 times) compared to other paradigms, while maintaining up to 99% accuracy (for IST) and 98% accuracy (for UIST) when compared to the state-of-the-art embedding-based paradigm."