Effiziente Verarbeitung und Analyse von Inhalten durch Ausrichtung multimodaler Daten zu Sprache, Molekülen und Proteinen
MOLBIND ist ein Framework, das Encoder für mehrere Modalitäten durch kontrastives Lernen trainiert und alle Modalitäten in einen gemeinsamen Merkmalsraum für multimodale semantische Ausrichtung abbildet. MOLBIND zeigt überlegene Zero-Shot-Lernleistung über eine Vielzahl von Aufgaben und demonstriert seine starke Fähigkeit, die zugrunde liegenden Semantiken mehrerer Modalitäten zu erfassen.