Core Concepts
Ein neuartiges 3D-Transformer-Modell mit selbstüberwachter Vortrainingsphase zur effizienten und robusten Erkennung von klinisch signifikantem Prostatakrebs in biparametrischer MRT.
Abstract
Die Studie präsentiert ein neuartiges 3D-Transformer-Modell namens CSwin UNet zur Erkennung von klinisch signifikantem Prostatakrebs (csPCa) in biparametrischer MRT (bpMRT). Das Modell besteht aus einem CSwin-Transformer-Encoder und einem CNN-Decoder, die über Skip-Verbindungen miteinander verbunden sind. Der CSwin-Encoder führt die Selbstaufmerksamkeit parallel in longitudinaler, vertikaler und horizontaler Richtung durch, um ein größeres rezeptives Feld zu erreichen. Außerdem wird eine skalierte Kosinus-Aufmerksamkeitsfunktion in den Transformer-Backbone integriert, um die Erkennungsleistung weiter zu verbessern.
Um die Datenverfügbarkeit zu erhöhen, wird ein selbstüberwachtes Vortrainingsverfahren mit mehreren Hilfsaufgaben vorgestellt. Dabei werden drei Pretext-Aufgaben - kontrastives Lernen, Kontextwiederherstellung und Rotationsvorhersage - mit einer automatisch gewichteten Verlustfunktion kombiniert. Während der Feinabstimmung wird der vortrainierte CSwin-Encoder verwendet, um die Leistung auf der Zielaufgabe der csPCa-Erkennung zu verbessern.
Die Leistung des Modells wird auf zwei öffentlichen bpMRT-Datensätzen evaluiert. Auf dem PI-CAI-Datensatz mit 1500 Scans erreicht das selbstüberwachte CSwin UNet eine AUC von 0,888 und eine durchschnittliche Präzision von 0,545, was signifikant besser ist als vergleichbare CNN- und Transformer-Methoden. Auf dem externen Prostate158-Datensatz mit 158 Scans erzielt das Modell eine AUC von 0,79 und eine durchschnittliche Präzision von 0,45, was ebenfalls die Leistung anderer Methoden übertrifft und eine gute Verallgemeinerungsfähigkeit auf externe Daten zeigt.
Stats
Die biparametrische MRT-Scans haben eine Auflösung von 0,5 mm² in der Bildebene und eine Schichtdicke von 3,6 mm.
Der PI-CAI-Datensatz umfasst 1500 Scans von 1476 Patienten, davon 1075 mit gutartigen Geweben oder indolenten PCa und 425 mit csPCa.
Der Prostate158-Datensatz umfasst 158 MRT-Scans mit Expertenannotationen.
Quotes
"Selbstüberwachtes Lernen zielt darauf ab, nützliche Darstellungen aus unmarkierten Daten zu lernen, ohne dass kostspielige Annotationen erforderlich sind."
"Unser vorgeschlagener Ansatz zur automatischen gewichteten Verlustfunktion vereinfacht den zeitaufwendigen Prozess der Bestimmung des optimalen Gewichts für die Hyperparameter jeder Pretext-Aufgabe."