Die Studie befasst sich mit der automatischen Erkennung von Gallenblasenkarzinomen (GBC) aus Ultraschallvideos. Bisherige bildbasierte Methoden zeigen begrenzte Leistungsfähigkeit, da einzelne Ultraschallbilder oft nicht genug Informationen zur Erkennung der Krebsmerkmale enthalten.
Die Autoren argumentieren für einen Paradigmenwechsel hin zur Videoanalyse, da Videos die inhärenten Vorteile von räumlich-zeitlichen Darstellungen nutzen können. Sie stellen einen neuartigen Ansatz namens FocusMAE vor, der die Auswahl der Maskierungstokens systematisch auf Regionen mit hoher Informationsdichte ausrichtet. Dadurch lernt das Modell eine verfeinerte Darstellung der Krebsmerkmale.
Die Autoren tragen außerdem den umfangreichsten Datensatz von Gallenblasenkarzinom-Ultraschallvideos bei. In Experimenten zeigt FocusMAE eine Genauigkeit von 96,4%, was deutlich über den bisherigen Spitzenleistungen von 84% liegt. Die Autoren demonstrieren auch die Allgemeingültigkeit des Ansatzes, indem sie ihn erfolgreich auf die Erkennung von COVID-19 aus CT-Scans anwenden.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Soumen Basu,... at arxiv.org 03-15-2024
https://arxiv.org/pdf/2403.08848.pdfDeeper Inquiries