이 연구는 약물 상담 시나리오에서 대규모 언어 모델의 성능을 평가하기 위한 새로운 벤치마크 MedicineQA를 소개한다. MedicineQA는 실제 온라인 의료 상담 기록을 바탕으로 구축된 다중 라운드 대화 데이터셋이다.
연구 결과, 기존의 검색 기반 대규모 언어 모델 접근법은 복잡한 대화 내역에서 관련 정보를 효과적으로 검색하는 데 어려움을 겪는 것으로 나타났다. 이를 해결하기 위해 저자들은 Distill-Retrieve-Read 프레임워크를 제안했다. 이 프레임워크는 대화 내역을 요약하여 검색 쿼리를 생성하고, 의약품 데이터베이스에서 관련 증거를 검색한 후, 검색된 증거를 활용하여 응답을 생성한다.
실험 결과, 제안된 RagPULSE 모델은 기존 모델들에 비해 증거 검색 정확도와 약물 상담 응답 성능이 크게 향상되었다. 이는 대화 내역 요약을 통한 효과적인 검색 쿼리 생성이 중요함을 보여준다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문