Die Studie untersucht die Eignung verschiedener Evaluierungsmetriken für die medizinische Bildübersetzung anhand zweier Aufgaben: der subtilen intramodalen Übersetzung von Brust-MRT-Bildern und der drastischeren intermodalen Übersetzung von Lendenwirbel-MRT zu CT.
Für die Brust-MRT-Übersetzung zeigt die Pixel-basierte Metrik SWD eine bessere Korrelation mit segmentierungsbasierten Metriken als die lernbasierten Wahrnehmungsmetriken FID, KID und IS. Für die MRT-zu-CT-Übersetzung versagt SWD jedoch, da es die größeren visuellen Unterschiede nicht erfassen kann.
Insgesamt korrelieren Wahrnehmungsmetriken nicht konsistent mit segmentierungsbasierten Metriken für die medizinische Bildübersetzung. FID erweist sich dabei als besonders unzuverlässig. Die Autoren empfehlen daher Vorsicht bei der Verwendung von FID und fordern weitere Forschung zu geeigneteren Evaluierungsansätzen für dieses Feld.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Nicholas Kon... klokken arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07318.pdfDypere Spørsmål