本文首先分析了現有的固定錨模態綁定(FABIND)方法的局限性,包括過度依賴錨模態的選擇、無法捕捉內部信息以及無法考慮非錨模態之間的相互信息。為了解決這些問題,作者提出了CentroBind方法,它使用動態可調的中心錨點來代替固定錨模態。
理論分析表明,CentroBind能夠有效地捕捉內部信息、相互信息以及多模態對齊,從而構建出一個更加鲁棒的統一表示空間。實驗結果也證實,與FABIND相比,CentroBind在合成數據集和真實數據集上的性能都有顯著提升,體現了其在多模態表示學習中的優越性。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Minoh Jeong,... ที่ arxiv.org 10-04-2024
https://arxiv.org/pdf/2410.02086.pdfสอบถามเพิ่มเติม