核心概念
がんの予防、早期発見、治療戦略を促進するために、多様なデータの統合が重要である。グラフニューラルネットワークやトランスフォーマーなどの高度な多様モーダル学習モデルが、包括的かつ詳細な理解を提供する可能性がある。
要約
本論文は、がん医療における多様なデータの統合に関する最新の進展を探る。
まず、がんに関するさまざまなデータモダリティ(画像、分子、臨床)について概説する。次に、多様モーダル学習(MML)の基本的な枠組みと手法(前処理、特徴抽出、データ融合、主要学習器、最終分類器)を説明する。
グラフニューラルネットワーク(GNN)は、がんの病理学的データ、放射線学的データ、分子データを統合するのに適している。GNNは、ノード、エッジ、グラフレベルの分析を可能にし、高次の構造情報を学習できる。GNNを用いた多様モーダル解析の事例を紹介する。
一方、トランスフォーマーは、自己注意機構を用いて、さまざまなデータモダリティ間の複雑な相互作用をモデル化できる。多様モーダルトランスフォーマーの主要な融合手法(早期融合、クロスアテンション、階層的融合、遅延融合)を説明し、がんデータへの適用例を示す。
最後に、データ量、アライメント、一般化、欠損データ、解釈可能性など、MMLに関する主要な課題と機会について議論する。がんの予防、早期発見、治療戦略を促進するためには、多様なデータの統合が不可欠であり、スケーラブルな深層学習フレームワークの開発が重要である。
統計
2023年、米国では約190万人の新規がん診断があり、1日約1670人がんで死亡すると予想されている。
早期発見と生活習慣の改善により、これらの症例の約42%を予防できる可能性がある。