MMIST-ccRCCデータセットは、618人の腎細胞がん患者の多様なデータを含む。データには、2つの放射線画像モダリティ(CT、MRI)、病理組織画像、ゲノミクス、臨床データが含まれる。患者間でデータの欠損が大きく、CTは40%、MRIは8%の患者でしか利用できない。
データセットを用いて12ヶ月生存予測の課題に取り組んだ。単一モダリティのベースラインモデルを評価し、臨床・ゲノミクスデータが最も良い性能を示した。多様なモダリティの統合では、特に早期融合手法が有効で、平均演算子を用いた手法が最も良い結果を示した。
さらに、欠損モダリティの再構築手法を提案し、評価した。再構築された特徴量を用いることで、特に放射線画像モダリティの性能が向上し、最終的に84.7%のバランス精度を達成した。これは、単一の臨床・ゲノミクスデータを用いた場合の73.16%を大きく上回る。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Tiago Mota,M... at arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.01658.pdfDeeper Inquiries