本論文では、ジェミニモデルの強力な一般的機能を基に、医療分野向けに特化したMed-Geminiモデルを開発した。
医療テキスト推論では、自己学習と Web 検索の統合により、医療知識の最新性を維持しつつ、複雑な臨床推論を行うことができる。MedQA (USMLE)ベンチマークでは91.1%の最高精度を達成し、従来の最高モデルを4.6%上回った。さらに、専門家による再評価を通じて、データの品質問題を特定し、モデルの性能を適切に評価した。
マルチモーダル理解では、fine-tuningと専用エンコーダの活用により、医療分野の特殊なモダリティにも適応できる。7つのマルチモーダルベンチマークで平均44.5%の相対的な性能向上を示した。
長文脈処理では、長い電子カルテの「ニードルインザヘイスタック」検索タスクや医療ビデオの質問応答タスクで最先端の性能を発揮した。
さらに、医療要約、紹介状生成、医療用語の平易化などの実用タスクでも、人間専門家を上回る性能を示した。これらの結果は、Med-Geminiが医療分野で大きな可能性を秘めていることを示唆するが、実世界での導入には慎重な検証が不可欠である。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문