Core Concepts
医療データの多様なソースから得られる情報を統合的に活用することで、人の健康と疾病の複雑さをより的確に捉えることができる。Gemini のような大規模多様モーダルモデルを医療分野に最適化することで、多様なタスクにおける優れた性能を実現できる。
Abstract
本レポートでは、Gemini をベースとした医療向けの新しいモデルファミリー「Med-Gemini」を開発し、その性能を評価した。
Med-Gemini は、Gemini の高度な推論、多様モーダル理解、長文脈処理の機能を活用しつつ、医療知識とデータを組み込むことで、医療分野の多様なタスクに対応できるようになっている。
具体的には、2D/3D 医療画像の分類、VQA、レポート生成、遺伝的リスク予測などの評価を行った。その結果、Med-Gemini は以下のような優れた性能を示した:
胸部X線レポート生成では、専門家評価で従来最高モデルを10-18%上回る性能を達成
病理組織、眼科、皮膚科の画像分類では、20タスクのうち18タスクで従来手法を上回る
遺伝的リスク予測では、従来の線形アプローチを上回る精度を示し、訓練していない関連疾患にも一般化できる
これらの結果は、大規模多様モーダルモデルが医療分野の複雑なタスクにおいても高い性能を発揮できることを示している。今後さらなる開発と評価が必要だが、Med-Gemini は医療分野での幅広い応用が期待できる。
Stats
胸部X線画像の正常/異常分類では、Med-Geminiが従来モデルを大幅に上回る性能を示した。
病理組織、眼科、皮膚科の画像分類では、Med-Geminiが20タスクのうち18タスクで従来手法を上回る性能を示した。
遺伝的リスク予測では、Med-Gemini-Polygenicが従来の線形アプローチを上回る精度を示し、訓練していない関連疾患にも一般化できることが分かった。