本文提出了一種新的多模態對比學習方法CoMM,能夠同時捕捉多模態之間的冗餘、獨特和協同信息。
首先,作者理論分析了多模態互動的三種形式:
現有的多模態對比學習方法只能捕捉冗餘信息,無法建模獨特和協同信息。
CoMM的設計包括兩個關鍵點:
理論分析表明,CoMM的目標函數能夠自然地捕捉這三種形式的多模態互動。實驗結果也驗證了CoMM在各種多模態任務上的優秀性能,超越了現有方法。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Benoit Dufum... a las arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.07402.pdfConsultas más profundas