Core Concepts
의료 질문 답변 시스템의 성능을 향상시키기 위해 SQuAD V2.0 데이터셋 구조와 emrQA 의료 데이터를 결합한 새로운 데이터셋 emrQA-msquad를 개발하였다.
Abstract
이 연구는 의료 질문 답변 시스템의 성능 향상을 위해 emrQA 데이터셋과 SQuAD V2.0 데이터셋을 결합한 새로운 데이터셋 emrQA-msquad를 개발하였다.
emrQA 데이터셋은 의료 정보가 풍부하지만 구조화되어 있지 않아 기존 질문 답변 모델의 성능이 저하되는 문제가 있었다. 이를 해결하기 위해 emrQA 데이터를 SQuAD V2.0 데이터셋 형식으로 재구조화하여 emrQA-msquad 데이터셋을 구축하였다.
emrQA-msquad 데이터셋은 163,695개의 질문과 4,136개의 수동으로 수집된 답변으로 구성되어 있다. 이 데이터셋을 활용하여 BERT, RoBERTa, Tiny RoBERTa 모델을 의료 도메인에 fine-tuning한 결과, F1 스코어가 10.1%에서 37.4%, 18.7%에서 44.7%, 16.0%에서 46.8%로 크게 향상되었다.
이를 통해 의료 도메인 특화 데이터셋을 활용한 모델 fine-tuning이 의료 질문 답변 시스템의 성능 향상에 효과적임을 확인할 수 있었다.
Stats
BERT 기준 모델의 경우 F1 스코어 0.75-1.00 범위의 응답 비율이 10.1%에서 37.4%로 증가했다.
RoBERTa 기준 모델의 경우 F1 스코어 0.75-1.00 범위의 응답 비율이 18.7%에서 44.7%로 증가했다.
Tiny RoBERTa 기준 모델의 경우 F1 스코어 0.75-1.00 범위의 응답 비율이 16.0%에서 46.8%로 증가했다.
Quotes
"의료 질문 답변 시스템의 성능 향상을 위해 emrQA 데이터셋과 SQuAD V2.0 데이터셋을 결합한 새로운 데이터셋 emrQA-msquad를 개발하였다."
"emrQA-msquad 데이터셋을 활용하여 BERT, RoBERTa, Tiny RoBERTa 모델을 fine-tuning한 결과, F1 스코어가 크게 향상되었다."