Durch die explizite Modellierung der Beziehungen zwischen Sprache und Bildern kann die Leistung bei der medizinischen Bildanalyse deutlich verbessert werden.