核心概念
의료 분야에서 LLM의 사실적 정확성과 신뢰성을 높이기 위해 관련 정보를 입력으로 제공하는 문맥 검색 방법이 핵심적인 접근법으로 부상했다.
要約
이 연구는 의료 분야에서 문맥 검색 방법의 한계를 탐구하고, 그 구성 요소를 최적화하며, 개방형 및 폐쇄형 대안과 성능을 벤치마킹한다.
연구 결과는 다음과 같다:
- 선택 순서 섞기, 앙상블 수 최적화 등 SC-CoT 구성 요소 최적화를 통해 상당한 성능 향상을 달성했다.
- 의료 특화 임베딩 모델 사용, 데이터베이스 확장 등 Medprompt 아키텍처 최적화로 개방형 LLM이 민간 솔루션 수준의 성능을 달성할 수 있음을 보였다.
- 다양한 개방형 LLM에 최적화된 문맥 검색 시스템을 적용하여, 작은 모델에서도 큰 모델 수준의 성능을 달성할 수 있음을 확인했다.
- 다중 선택형 질문 답변의 한계를 인식하고, 개방형 답변 생성을 위한 OpenMedprompt 프레임워크를 제안했다. 이는 반복적 피드백 루프와 보상 모델 점수 통합을 통해 개방형 답변 정확도를 향상시킨다.
統計
선택 순서 섞기를 적용하면 모든 데이터셋에서 1-3% 정도의 정확도 향상이 있었다.
앙상블 수를 늘리면 정확도가 지속적으로 향상되지만, 5-6개 이상에서는 수확체감이 나타났다. 20개 앙상블까지 늘리면 약 1.76 kg의 CO2 배출이 발생했다.
의료 특화 임베딩 모델인 PubMedBERT를 사용하는 것이 가장 효과적이었다.
CoT 기반 데이터베이스 확장이 대부분의 데이터셋에서 성능 향상에 기여했다.
引用
"의료 분야에서 LLM의 사실적 정확성과 신뢰성을 높이기 위해 관련 정보를 입력으로 제공하는 문맥 검색 방법이 핵심적인 접근법으로 부상했다."
"개방형 LLM이 최적화된 문맥 검색 시스템과 결합하면 민간 솔루션 수준의 성능을 달성할 수 있다."
"다중 선택형 질문 답변의 한계를 인식하고, 개방형 답변 생성을 위한 OpenMedprompt 프레임워크를 제안했다."