이 논문은 다중 모달 추천 프레임워크인 EM3를 제안한다. EM3는 다중 모달 정보를 충분히 활용하고 개인화된 랭킹 작업을 통해 다중 모달 모델의 핵심 모듈을 직접 학습하여 리소스 소비를 과도하게 늘리지 않으면서 더 작업 지향적인 콘텐츠 특징을 얻는다.
첫째, Fusion-Q-Former를 제안하여 다양한 모달리티를 융합하고 고정 길이의 강건한 다중 모달 임베딩을 생성한다.
둘째, 사용자 콘텐츠 관심 순차 모델링에서 Low-Rank Adaptation 기술을 활용하여 거대한 학습 매개변수 수와 긴 시퀀스 길이 간의 갈등을 완화한다.
셋째, 콘텐츠와 ID를 서로 정렬하는 새로운 Content-ID-Contrastive 학습 작업을 제안하여 더 작업 지향적인 콘텐츠 임베딩과 더 일반화된 ID 임베딩을 얻는다.
실험에서 EM3는 오프라인 데이터셋과 온라인 A/B 테스트에서 모두 유의미한 성능 향상을 보였다. 또한 공개 데이터셋에서도 최신 기술을 능가하는 결과를 보였다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Xiuqi Deng,L... a las arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06078.pdfConsultas más profundas