핵심 개념
본 논문에서는 임상의가 선호하는 특정 주제에 맞춰 요약을 생성하는, 대규모 언어 모델(LLM) 기반의 향상된 전자 건강 기록(EHR) 텍스트 요약 시스템을 제안합니다.
초록
대규모 언어 모델을 사용한 향상된 전자 건강 기록 텍스트 요약: 임상의 선호도 기반 요약 생성 시스템 개발
본 연구는 임상의의 선호도를 중심으로 EHR 요약을 생성하는 데 대규모 언어 모델(LLM)을 활용하는 방법을 제시한 연구 논문입니다.
본 연구는 기존의 일반적인 EHR 요약 시스템의 한계점을 지적하고, 임상의 개별 필요에 맞춘 EHR 요약 시스템을 개발하는 것을 목표로 합니다.
본 연구에서는 Google Flan-T5 모델을 기반으로 질문 답변 EHR 데이터 세트를 사용하여 임상의 선호도 기반 요약을 생성하는 시스템을 개발했습니다. Stanford Question Answering Dataset (SQuAD) 형식으로 변환된 데이터 세트를 활용하여 Flan-T5 모델을 미세 조정하고, Hugging Face Transformers 라이브러리의 Seq2SeqTrainer를 사용하여 모델을 학습시켰습니다. 모델의 성능 평가에는 Exact Match (EM), Recall-Oriented Understudy for Gisting Evaluation (ROUGE), Bilingual Evaluation Understudy (BLEU) 등의 평가 지표를 사용했습니다.