Effiziente Bildtext-Retrieval durch Multi-Lehrer-Cross-Modalitäts-Alignment-Destillation
Durch die Integration der Vorteile von Single-Stream- und Dual-Stream-Modellen erreicht das vorgeschlagene MCAD-Verfahren eine hohe Retrieval-Leistung, ohne die Inferenz-Komplexität zu erhöhen.