Core Concepts
Der Einsatz von Bildtransformer-Architekturen in Kombination mit Multi-Skalen-Klassifikation und Multi-Objective-Learning kann die Leistung bei der Prostatakrebserkennung aus Ultraschallbildern deutlich verbessern.
Abstract
Die Studie untersucht den Einsatz verschiedener Bildtransformer-Architekturen (Vision Transformer, Compact Convolutional Transformer, Pyramid Vision Transformer) für die Erkennung von Prostatakrebs aus Ultraschallbildern. Dabei werden sowohl Ansätze auf Ebene einzelner Regionen von Interesse (ROIs) als auch Multi-Skalen-Ansätze, die den Kontext mehrerer ROIs berücksichtigen, evaluiert.
Die Ergebnisse zeigen, dass die Transformer-basierten Modelle die Leistung eines konventionellen CNN-Basismodells (modifiziertes ResNet18) auf ROI-Ebene nicht übertreffen können. Allerdings führt der Einsatz eines Multi-Skalen-Ansatzes mit einem BERT-Klassifikator zu einer deutlichen Verbesserung der Gesamtleistung. Durch den Einsatz eines neuartigen Multi-Objective-Lernziels, das sowohl ROI-basierte als auch Kern-basierte Vorhersagen berücksichtigt, kann die Leistung weiter gesteigert werden. Das beste Modell (ResNet18 + BERT + Multi-Objective) erreicht eine AUROC von 77,9%, eine Sensitivität von 75,9% und eine Spezifität von 66,3%, was eine signifikante Verbesserung gegenüber den Basismodellen darstellt.
Die Autoren schließen daraus, dass der kombinierte Einsatz von Bildtransformern und Multi-Objective-Learning das Potenzial hat, die Leistung bei der Prostatakrebserkennung aus Ultraschallbildern zu verbessern.
Stats
Die Studie verwendet einen Datensatz von 6.607 Prostatastanzbiopsien, die von 693 Patienten an 5 verschiedenen klinischen Zentren entnommen wurden.
86,7% der Datensätze sind nicht-krebsig.
Quotes
"Unser Kern-basiertes Multi-Objective-Modell erreicht eine AUROC von 77,9%, eine Sensitivität von 75,9% und eine Spezifität von 66,3%, was eine erhebliche Verbesserung gegenüber den Basismodellen darstellt."
"Wir schließen daraus, dass der kombinierte Einsatz von Bildtransformern und Multi-Objective-Learning das Potenzial hat, die Leistung bei der Prostatakrebserkennung aus Ultraschallbildern zu verbessern."