이 논문은 MedPromptX라는 새로운 모델을 소개합니다. MedPromptX는 흉부 X-레이 진단을 위해 임상 기록과 영상 데이터를 통합합니다.
주요 내용은 다음과 같습니다:
불완전한 전자 건강 기록 데이터 문제를 해결하기 위해 사전 훈련된 다중 모달 대형 언어 모델을 활용하여 누락된 정보를 보완합니다.
소수 샷 프롬프팅을 통해 라벨링된 데이터가 적은 상황에서도 신속하게 새로운 진단 작업에 적응할 수 있습니다. 또한 이를 통해 대형 언어 모델의 환각 문제를 해결합니다.
동적 근접성 선택(DPS) 기법을 제안하여 소수 샷 데이터를 실시간으로 정제함으로써 모델 성능을 향상시킵니다.
시각적 접지를 통해 X-레이 이미지의 관련 영역에 초점을 맞추어 비정상 소견을 더 잘 식별할 수 있습니다.
MedPromptX-VQA라는 새로운 다중 모달 데이터셋을 구축하여 이미지와 구조화된 의료 데이터가 결합된 상황에서의 시각적 질문 답변 작업을 지원합니다.
실험 결과, MedPromptX는 기존 모델 대비 11% 향상된 F1 점수를 달성하며 SOTA 성능을 보였습니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문