In dieser Studie wird untersucht, wie große Sprachmodelle (Large Language Models, LLMs) genutzt werden können, um Informationen zum Schweregrad von Substanzgebrauchsstörungen (Substance Use Disorder, SUD) aus klinischen Notizen zu extrahieren.
Die Autoren entwickelten einen Workflow, der auf dem Zero-Shot-Learning-Ansatz mit sorgfältig konzipierten Aufforderungen (Prompts) und Nachbearbeitungstechniken basiert. Durch Experimente mit dem Flan-T5-Modell zeigten sie, dass dieses Modell eine höhere Trefferquote im Vergleich zu regelbasierten Ansätzen aufweist.
Die Studie konzentrierte sich auf 11 Kategorien von SUD-Diagnosen und demonstrierte die Effektivität von LLMs bei der Extraktion von Schweregrad-Informationen. Dies trägt zu einer verbesserten Risikobewertung und Behandlungsplanung für Patienten mit Substanzgebrauchsstörungen bei.
Im Vergleich zu regelbasierten regulären Ausdrücken (Regular Expressions, RegEx) übertraf das LLM-Modell in 7 von 11 SUD-Kategorien die Leistung. Dies lässt sich auf die nuancierten und vielfältigen Ausdrucksweisen von SUD-Diagnosen in klinischen Notizen zurückführen, die nicht gut mit den starren RegEx-Regeln übereinstimmen.
Die Autoren identifizierten auch Fälle, in denen RegEx besser abschnitt als das LLM-Modell, insbesondere bei Kategorien wie Alkohol, Cannabis, Koffein und Inhalativa. Dies deutet darauf hin, dass eine Kombination aus LLM und RegEx-Ansätzen in bestimmten Fällen vorteilhaft sein könnte.
Insgesamt zeigt diese Studie, dass LLMs vielversprechend sind, um wichtige Informationen zur Schweregrad-Einschätzung von Substanzgebrauchsstörungen aus klinischen Notizen zu extrahieren und damit die Risikobewertung und Behandlungsplanung für Patienten zu verbessern.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы