Multifunktionales Sehen-Sprache-Modell für generalisierbare, annotationsfreie Lokalisierung pathologischer Läsionen
Ein multifunktionales Sehen-Sprache-Modell, das pathologische Läsionen in medizinischen Bildern ohne Annotationen präzise lokalisieren kann, indem es Mehrebenen-Semantik-Strukturen in Bild- und Textdaten nutzt.