Temel Kavramlar
Offene Sprach-Großmodelle können ohne Trainingsdaten Informationen zum Krebsstadium aus unstrukturierten Pathologieberichten extrahieren.
Özet
Die Studie untersucht die Fähigkeit von Open-Source-Sprach-Großmodellen (Large Language Models, LLMs), das pathologische Tumor-Lymphknoten-Metastasen (pTNM)-Stadium aus unstrukturierten Pathologieberichten zu extrahieren, ohne auf Trainingsdaten angewiesen zu sein.
Die Autoren verwenden drei LLMs - ein allgemeines (Llama-2-70b-chat) und zwei klinische (ClinicalCamel-70B und Med42-70B) - und vergleichen deren Leistung mit einem vortrainierten Clinical-BigBird-Modell, das auf denselben Daten feinabgestimmt wurde.
Die Ergebnisse zeigen, dass die LLMs ohne Feinabstimmung eine vergleichbare oder sogar bessere Leistung bei der Klassifizierung des N-Stadiums und des M-Stadiums erreichen können. Beim T-Stadium schneidet das feinabgestimmte Modell jedoch besser ab.
Die Autoren stellen fest, dass die Verwendung von Prompting-Strategien wie "Zero-Shot Chain-of-Thought" die Leistung der LLMs verbessern kann. Die Ergebnisse deuten darauf hin, dass Open-Source-LLMs großes Potenzial für die Verarbeitung klinischer Notizen und die Beschleunigung der Krebsforschung haben.
İstatistikler
Die Studie verwendet 6.940 Pathologieberichte aus dem TCGA-Projekt (Cancer Genomic Atlas) mit zugehörigen Etiketten für die T-, N- und M-Stadien.
Alıntılar
"Offene Sprach-Großmodelle sind in der Lage, ohne Trainingsdaten vergleichbare oder sogar bessere Leistung bei der Klassifizierung des N-Stadiums und des M-Stadiums zu erreichen."
"Die Verwendung von Prompting-Strategien wie 'Zero-Shot Chain-of-Thought' kann die Leistung der LLMs verbessern."