Core Concepts
Vorschlag eines neuartigen Ansatzes zur gemeinsamen Schulung eines Kachelcodierers und eines Slide-Aggregators vollständig im Speicher und end-to-end in hoher Auflösung.
Abstract
Abstract:
KI hat das Potenzial, die Gesundheitsergebnisse durch das Training von Systemen auf umfangreichen digitalisierten klinischen Datensätzen zu verbessern.
Computergestützte Pathologie steht an vorderster Front dieser Entwicklung.
Gigapixel-Pathologieslides stellen eine einzigartige Herausforderung dar.
Schwach überwachtes Lernen wird häufig verwendet, formalisiert mit Multiple Instance Learning (MIL).
Training von Modellen von gesamten Pathologieslides end-to-end wurde bisher weitgehend unerforscht.
Einführung:
Anwendung von KI im medizinischen Bereich hat das Potenzial, die Gesundheits- und Krankheitsergebnisse der Bevölkerung zu verbessern.
Digitale Pathologieslides sind um Größenordnungen größer als andere medizinische Bildmodalitäten.
Pathologieslides werden häufig in Tausende von kleinen Kacheln für die Analyse unterteilt.
Die meisten Arbeiten in der computergestützten Pathologie fallen in zwei Hauptkategorien: Ansätze, die sich auf das Training eines Kachelcodierers konzentrieren, und Ansätze, die sich auf das Training eines Slide-Aggregators konzentrieren.
Methode:
Moderne GPUs ermöglichen das gemeinsame Training eines Kachelcodierers und eines Slide-Aggregators end-to-end.
Es ist möglich, die Merkmalscodierung zu parallelisieren, indem Kacheln auf mehrere GPUs verteilt werden.
Es ist möglich, Encoder und Aggregator auf verschiedene GPU-Gruppen aufzuteilen.
Ergebnisse:
Experimentelle Beweise für die Äquivalenz von Single- und Multi-GPU-Läufen.
Anwendung des vorgeschlagenen Systems auf die Vorhersage von EGFR-Mutationen bei Lungenadenokarzinom-Patienten.
Maximale Validierung AUC von 0,968 nach 30 Epochen für die Brustkrebsdetektion.
Diskussion:
Verbindung von Schritten in einem end-to-end-Stil könnte eine bessere Repräsentation eines Pathologieslides ermöglichen.
Die vorgeschlagene Methode übertrifft alle bisherigen Schulungsstrategien, einschließlich groß angelegtem SSL-Pre-Training.
Das vorgeschlagene Framework kann auf verschiedene Anwendungsfälle angepasst werden und ermöglicht die Analyse eines gesamten Pathologieslides.
Stats
Moderne GPUs ermöglichen das gemeinsame Training eines Kachelcodierers und Slide-Aggregators end-to-end.
Es ist möglich, die Merkmalscodierung zu parallelisieren, indem Kacheln auf mehrere GPUs verteilt werden.
Es ist möglich, Encoder und Aggregator auf verschiedene GPU-Gruppen aufzuteilen.
Quotes
"Das vorgeschlagene Framework ermöglicht die Analyse eines gesamten Pathologieslides."
"Die vorgeschlagene Methode übertrifft alle bisherigen Schulungsstrategien, einschließlich groß angelegtem SSL-Pre-Training."