Core Concepts
Durch Feinabstimmung großer Sprachmodelle können präzise und kohärente Zusammenfassungen von psychologischen Patientengesprächen erstellt werden, um die Arbeitsbelastung von Psychiatern zu reduzieren.
Abstract
Die Studie untersucht die Leistungsfähigkeit verschiedener großer Sprachmodelle (LLMs) bei der Erstellung von Zusammenfassungen aus psychologischen Patientengesprächen. Dafür wurde ein Datensatz mit 300 Teilnehmern erstellt, bei denen ein standardisierter psychologischer Fragebogen durchgeführt wurde. Die Antworten wurden in simulierte Arzt-Patienten-Dialoge umgewandelt.
Die Ergebnisse zeigen, dass das feinabgestimmte BART-large-CNN-Modell die besten Ergebnisse erzielt, mit ROUGE-1- und ROUGE-L-Werten von 0,810 bzw. 0,764. Das Modell übertrifft damit bestehende Baseline-Modelle deutlich. Darüber hinaus wurde die Übertragbarkeit des Modells auf einen öffentlich zugänglichen Datensatz untersucht, mit vielversprechenden Ergebnissen.
Die Studie zeigt, dass durch Feinabstimmung großer Sprachmodelle auf begrenzten Trainingsdaten präzise und kohärente Zusammenfassungen von psychologischen Patientengesprächen erstellt werden können. Dies könnte dazu beitragen, die Arbeitsbelastung von Psychiatern in Ländern mit begrenzten Ressourcen im Gesundheitswesen zu reduzieren.
Stats
"Die durchschnittliche Länge der Patientenäußerungen beträgt 2054 Zeichen, während die durchschnittliche Länge der gesamten Dialogkonversation 3662 Zeichen beträgt."
"Das feinabgestimmte BART-large-CNN-Modell erreicht ROUGE-1- und ROUGE-L-Werte von 0,810 bzw. 0,764."
Quotes
"Durch Feinabstimmung großer Sprachmodelle können präzise und kohärente Zusammenfassungen von psychologischen Patientengesprächen erstellt werden, um die Arbeitsbelastung von Psychiatern zu reduzieren."
"Das feinabgestimmte BART-large-CNN-Modell übertrifft bestehende Baseline-Modelle deutlich."