Khái niệm cốt lõi
Multimodale Übersetzungsmodelle sollten anhand von visuellen Informationen und der Fähigkeit, komplexe Sätze zu übersetzen, bewertet werden.
Thống kê
Die Multi30k-Testdatensätze sind nicht ausreichend für die Bewertung von MMT-Modellen.
Die CoMMuTE-Bewertungsrahmen messen die Verwendung von visuellen Informationen.
Die WMT-Nachrichtenübersetzungstests bewerten die Leistung gegen komplexe Sätze.
Trích dẫn
"Ein guter Bewertungsrahmen sollte die Verwendung visueller Informationen durch MMT-Modelle messen."
"Die meisten aktuellen Arbeiten in MMT konzentrieren sich auf den Multi30k-Datensatz."