Analyse von Benchmarking großer Sprachmodelle zur Beantwortung und Erklärung schwieriger medizinischer Fragen
Große Sprachmodelle zeigen beeindruckende Leistungen bei der Beantwortung medizinischer Fragen, aber es besteht Bedarf an neuen Metriken für die Bewertung von Modellerklärungen.