이 논문은 사용자의 관심사를 정확하게 포착하고 이에 맞는 개인화된 클러스터링 결과를 제공하는 새로운 방법인 Multi-MaP를 제안한다.
주요 내용은 다음과 같다:
사용자의 간단한 키워드를 활용하여 데이터의 다양한 관점을 포착할 수 있도록 CLIP 인코더와 GPT-4를 활용한 멀티모달 프록시 학습 방법을 제안한다.
참조 단어 제약과 개념 수준 제약을 통해 사용자의 관심사에 맞는 최적의 프록시 단어 표현을 학습한다.
다양한 벤치마크 데이터셋에 대한 실험 결과, Multi-MaP가 기존 최신 방법들을 모두 능가하는 성능을 보여주었다.
CLIP 인코더가 데이터의 다양한 의미적 측면을 포착할 수 있음을 최초로 입증하였다.
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Jiawei Yao,Q... klokken arxiv.org 04-25-2024
https://arxiv.org/pdf/2404.15655.pdfDypere Spørsmål