核心概念
Ein neuartiges End-to-End-Framework für den medizinischen Befundabgleich, das ein multimodales Großsprachmodell nutzt, um Schlüsselphrasen automatisch aus medizinischen Berichten zu extrahieren und die entsprechenden Umgrenzungsboxen in medizinischen Bildern vorherzusagen.
摘要
Das vorgestellte Medical Report Grounding (MedRG)-Framework verwendet ein multimodales Großsprachmodell, um den medizinischen Befundabgleich effizienter und genauer durchzuführen.
Zunächst extrahiert das Großsprachmodell automatisch Schlüsselphrasen aus dem medizinischen Bericht, indem es einen neuen -Token in den Wortschatz aufnimmt. Dieser Token dient als Einbettung, um die Erkennungsfähigkeiten des Modells zu verbessern.
Anschließend wird der versteckte Einbettungsvektor des -Tokens zusammen mit dem Eingabebild von einem Encoder-Decoder-Netzwerk genutzt, um die entsprechende Umgrenzungsbox vorherzusagen.
Die Experimente zeigen, dass das MedRG-Verfahren die Leistung bestehender Methoden für den medizinischen Befundabgleich deutlich übertrifft. Es erzielt Spitzenwerte bei der Genauigkeit der Boxvorhersage und der Extraktion von Schlüsselphrasen. Damit stellt es einen Meilenstein in der Anwendung von Großsprachmodellen für medizinische Bildanalyseaufgaben dar.
統計資料
Die Größe des Herzschemens ist leicht vergrößert.
Es gibt eine moderate rechtsseitige Pneumothorax.
Es gibt eine rechtsseitige basale Atelektase.
引述
"Medizinischer Befundabgleich zielt darauf ab, Verbindungen zwischen medizinischen Berichten und Regionen von Interesse (ROI) in medizinischen Bildern herzustellen."
"Unser Beitrag stellt einen bahnbrechenden Ansatz dar: ein End-to-End-Framework für den medizinischen Befundabgleich, das von Großsprachmodellen angetrieben wird."