Core Concepts
Unser Modell kann Pathologieberichte für gigapixel-große Ganzkörperaufnahmen generieren, die mehrere klinische Hinweise enthalten und bei bestimmten Aufgaben auf Ebene der Präparate eine wettbewerbsfähige Leistung erzielen.
Abstract
In dieser Arbeit präsentieren wir einen Ansatz zur automatischen Erstellung von Pathologieberichten für gigapixel-große Ganzkörperaufnahmen (Whole Slide Images, WSI).
Auf der Datenebene haben wir den größten WSI-Text-Datensatz (TCGA-PathoText) kuratiert, indem wir fast 10.000 hochwertige WSI-Text-Paare aus TCGA extrahiert und bereinigt haben.
Auf der Modellseite schlagen wir das Multiple Instance Generation (MI-Gen)-Modell vor, das Pathologieberichte für gigapixel-große WSIs erstellen kann. Wir haben unser Modell auf dem größten Teilsatz von TCGA-PathoText getestet. Die Ergebnisse zeigen, dass unser Modell Pathologieberichte generieren kann, die mehrere klinische Hinweise enthalten, und bei bestimmten Aufgaben auf Ebene der Präparate eine wettbewerbsfähige Leistung erzielt. Wir beobachten, dass die einfache semantische Extraktion aus den Pathologieberichten die beste Leistung (F1-Score von 0,838) bei der BRCA-Subtypisierung erzielt und damit frühere State-of-the-Art-Ansätze übertrifft.
Stats
Die TCGA-PathoText-Sammlung enthält insgesamt 9.009 WSI-Text-Paare.
Unser generiertes Modell erreicht einen F1-Score von 0,838 bei der BRCA-Subtypisierung.
Quotes
"Unser Modell kann Pathologieberichte generieren, die mehrere klinische Hinweise enthalten und bei bestimmten Aufgaben auf Ebene der Präparate eine wettbewerbsfähige Leistung erzielen."
"Wir beobachten, dass die einfache semantische Extraktion aus den Pathologieberichten die beste Leistung (F1-Score von 0,838) bei der BRCA-Subtypisierung erzielt und damit frühere State-of-the-Art-Ansätze übertrifft."