Die Studie untersucht die Leistungsfähigkeit verschiedener großer Sprachmodelle (LLMs) bei der Erstellung von Zusammenfassungen aus psychologischen Patientengesprächen. Dafür wurde ein Datensatz mit 300 Teilnehmern erstellt, bei denen ein standardisierter psychologischer Fragebogen durchgeführt wurde. Die Antworten wurden in simulierte Arzt-Patienten-Dialoge umgewandelt.
Die Ergebnisse zeigen, dass das feinabgestimmte BART-large-CNN-Modell die besten Ergebnisse erzielt, mit ROUGE-1- und ROUGE-L-Werten von 0,810 bzw. 0,764. Das Modell übertrifft damit bestehende Baseline-Modelle deutlich. Darüber hinaus wurde die Übertragbarkeit des Modells auf einen öffentlich zugänglichen Datensatz untersucht, mit vielversprechenden Ergebnissen.
Die Studie zeigt, dass durch Feinabstimmung großer Sprachmodelle auf begrenzten Trainingsdaten präzise und kohärente Zusammenfassungen von psychologischen Patientengesprächen erstellt werden können. Dies könnte dazu beitragen, die Arbeitsbelastung von Psychiatern in Ländern mit begrenzten Ressourcen im Gesundheitswesen zu reduzieren.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Manjeet Yada... pada arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.20145.pdfPertanyaan yang Lebih Dalam