核心概念
本文提出了一種新的自監督學習架構 KDC-MAE,它結合了對比學習、遮罩數據建模和知識蒸餾,以學習更強大的多模態表示。
Bora, M., Atreya, S., Mukherjee, A., & Das, A. (2024). KDC-MAE: Knowledge Distilled Contrastive Mask Auto-Encoder. arXiv preprint arXiv:2411.12270v1.
本研究旨在探討如何結合多種自監督學習方法,以提升多模態表示學習的效能。具體來說,研究者希望結合對比學習、遮罩數據建模和知識蒸餾的優勢,開發出一種更強大的自監督學習架構。