Core Concepts
의료 영상 및 유전체 데이터를 활용하여 다양한 의료 과제를 수행할 수 있는 Med-Gemini 모델을 개발하였으며, 이를 통해 기존 최고 성능을 뛰어넘는 결과를 달성하였다.
Abstract
이 연구는 의료 데이터의 복잡성을 포착하기 위해 다중 모달 AI 솔루션을 개발하는 것을 목표로 하였다. 기존 AI 의료 연구는 단일 입력 및 출력 유형의 좁은 과제에 초점을 맞추었지만, 최근 생성 AI 기술의 발전으로 다중 모달, 다중 과제 문제를 해결할 수 있게 되었다.
이를 위해 연구진은 Gemini 모델을 의료 분야에 특화된 Med-Gemini 모델로 fine-tuning하였다. Med-Gemini는 2D 및 3D 의료 영상, 병리학, 안과학, 피부과학, 유전체 데이터를 활용할 수 있다.
구체적인 결과는 다음과 같다:
Med-Gemini-2D는 기존 최고 성능 대비 흉부 X선 보고서 생성에서 1%와 12%의 절대 향상을 보였다. 정상 사례의 57%와 96%, 비정상 사례의 43%와 65%가 전문의 보고서와 동등하거나 더 나은 것으로 평가되었다.
Med-Gemini-2D는 흉부 X선 VQA에서 이전 최고 성능을 넘어섰고, 분류 및 방사선 VQA에서도 20개 과제 중 17개에서 최고 성능 또는 기준을 초과하였다.
병리학, 안과학, 피부과학 영상 분류에서 Med-Gemini-2D는 20개 과제 중 18개에서 기준을 넘어섰고 과제 특화 모델 성능에 근접하였다.
Med-Gemini-Polygenic은 표준 선형 다중 유전자 위험 점수 접근법보다 질병 위험 예측 성능이 우수하며, 학습하지 않은 유전적 상관 질병에도 일반화되었다.
이러한 결과는 Med-Gemini가 다양한 의료 과제에서 큰 잠재력을 가지고 있음을 보여준다. 향후 안전성 검증 등 추가 연구가 필요하지만, 의료 분야에서 다중 모달 기반 모델의 활용 가능성을 시사한다.
Stats
정상 사례의 57%와 96%가 전문의 보고서와 동등하거나 더 나은 것으로 평가되었다.
비정상 사례의 43%와 65%가 전문의 보고서와 동등하거나 더 나은 것으로 평가되었다.
Med-Gemini-2D는 흉부 X선 VQA에서 이전 최고 성능을 넘어섰다.
Med-Gemini-2D는 분류 및 방사선 VQA에서 20개 과제 중 17개에서 최고 성능 또는 기준을 초과하였다.
Med-Gemini-2D는 병리학, 안과학, 피부과학 영상 분류에서 20개 과제 중 18개에서 기준을 넘어섰고 과제 특화 모델 성능에 근접하였다.
Med-Gemini-Polygenic은 표준 선형 다중 유전자 위험 점수 접근법보다 질병 위험 예측 성능이 우수하며, 학습하지 않은 유전적 상관 질병에도 일반화되었다.
Quotes
"정상 사례의 57%와 96%가 전문의 보고서와 동등하거나 더 나은 것으로 평가되었다."
"비정상 사례의 43%와 65%가 전문의 보고서와 동등하거나 더 나은 것으로 평가되었다."
"Med-Gemini-2D는 흉부 X선 VQA에서 이전 최고 성능을 넘어섰다."
"Med-Gemini-Polygenic은 표준 선형 다중 유전자 위험 점수 접근법보다 질병 위험 예측 성능이 우수하며, 학습하지 않은 유전적 상관 질병에도 일반화되었다."