이 연구는 대규모 언어 모델(LLM)을 의료 도메인에 적응시켜 임상 텍스트 요약 성능을 평가했다. 8개의 LLM과 2가지 적응 방법(in-context learning, QLoRA)을 사용하여 4가지 임상 요약 작업(방사선 보고서, 환자 질문, 진료 기록, 의사-환자 대화)을 수행했다. 정량적 평가와 10명의 의사로 구성된 임상 독자 연구를 통해 LLM 요약이 의료 전문가 요약과 동등하거나 우수한 것으로 나타났다. 특히 LLM 요약이 의료 전문가 요약보다 더 완전하고 정확한 것으로 나타났다. 안전성 분석을 통해 LLM과 의료 전문가 모두 잘못된 정보를 생성할 수 있음을 확인했다. 이 연구 결과는 LLM을 임상 워크플로에 통합하여 의료 종사자의 문서 작업 부담을 줄이고 환자 진료에 더 집중할 수 있게 할 수 있음을 시사한다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究