Core Concepts
대규모 언어 모델을 활용하여 임상 기록에서 11가지 물질 사용 장애 진단의 심각도 정보를 효과적으로 추출할 수 있다.
Abstract
이 연구는 대규모 언어 모델(LLM)을 활용하여 임상 기록에서 물질 사용 장애(SUD) 진단의 심각도 정보를 추출하는 방법을 제안한다.
연구 내용은 다음과 같다:
577개의 임상 기록을 대상으로 11가지 SUD 진단 범주(알코올, 아편, 대마초 등)의 심각도 정보를 전문가가 수동으로 주석 처리했다.
Flan-T5 LLM을 활용하여 제로샷 학습(zero-shot learning) 방식으로 SUD 진단 심각도 정보를 추출했다.
정교한 프롬프트 설계와 후처리 기법을 통해 LLM의 성능을 높였다.
LLM의 성능을 규칙 기반 정규 표현식(RegEx) 접근법과 비교했을 때, LLM이 대부분의 SUD 범주에서 더 나은 recall 성능을 보였다.
이 연구는 LLM을 활용하여 SUD 진단의 심각도, 금단 증상, 사회적 건강 결정 요인 등 다양한 정보를 추출하는 더 큰 목표의 초석이 된다.
Stats
알코올 사용 장애 진단의 심각도 수준은 "severe etoh use d/o"로 나타났다.
아편 사용 장애 진단은 "opioid (heroin/ vicodin) use disorder - severe (on agonist therapy)"로 기록되었다.
대마초 사용 장애 진단은 "cannabis (thc vape) use disorder, mild"로 표현되었다.
Quotes
"cannabis/alcohol/opioid use disorder: mild"
"alcohol use disorder mod/severe"
"moderate caffeine use do"