核心概念
本稿では、単一ソースドメインの画像のみを用いて、異なるモダリティの医療画像に対して高い汎化性能を持つセグメンテーションモデルを学習する手法を提案する。これは、大規模な事前学習済み拡散モデルの生成的な事前分布と、制御可能な拡散モデルを用いたスタイル介入を通じて実現される。
要約
単一ソースクロスモダリティ医療画像セグメンテーションのための不変因果メカニズムを用いた汎化可能な手法
書誌情報: Boqi Chen, Yuanzhi Zhu, Yunke Ao, Sebastiano Caprara, Reto Sutter, Gunnar Rätsch, Ender Konukoglu, Anna Susmelj. Generalizable Single-Source Cross-modality Medical Image Segmentation via Invariant Causal Mechanisms. arXiv preprint arXiv:2411.05223v1 [cs.CV] 7 Nov 2024.
研究目的: 異なるモダリティの医療画像に対して、単一ソースドメインのデータのみを用いて、高い汎化性能を持つセグメンテーションモデルを学習する手法を開発すること。
手法: 本稿では、因果関係に基づいたドメイン汎化の理論的進歩と、拡散ベースのaugmentationの最新技術を組み合わせた手法を提案する。具体的には、データ生成プロセスを構造的因果モデル(SCM)として捉え、観察データ、ラベル(セグメンテーションマスク)、および観察されない潜在変数(コンテンツとスタイル)間の依存関係を表現する。そして、「介入-augmentation等価性」の原則に基づき、制御可能な拡散モデル(DM)を用いて、コンテンツを維持しながら、テキストプロンプトを通じて多様なイメージングスタイルをシミュレートするスタイルaugmentation手法を開発した。
主な貢献点:
因果関係の仮定に基づいたドメイン汎化に関する理論的進歩を活用し、ドメイン不変表現を学習するためのアプローチを設計した。
事前学習済みテキスト-to-イメージDMの豊富な生成事前分布を活用したスタイル介入手法を提案した。
3つの異なる解剖学的構造とイメージングモダリティにわたる、困難なクロスモダリティセグメンテーションタスクに関する広範な実験を通じて、提案手法の有効性を実証した。その結果、3つの異なる解剖学的構造とイメージングモダリティにわたって、最先端のSDG手法を一貫して上回る性能を達成した。
主な結果: 腹部セグメンテーション、腰椎セグメンテーション、肺セグメンテーションの3つのタスクにおいて、CT、MRI、X線という3つのイメージングモダリティを用いて提案手法を評価した。その結果、提案手法は、いずれのタスクにおいても、既存の最先端手法を上回る性能を達成した。
結論: 本稿で提案する手法は、単一ソースドメインのデータのみを用いて、異なるモダリティの医療画像に対して高い汎化性能を持つセグメンテーションモデルを学習することを可能にする。これは、医療画像セグメンテーションにおけるドメインシフト問題に対する有望な解決策となる可能性がある。
今後の研究: ControlNetの制限を受け継いでいるため、条件付きセグメンテーションマスクの細かい詳細に対応する画像の生成に苦労する。そのため、生成された解剖学的構造と与えられたセグメンテーションマスクとの正確な対応には、[26]のような解剖学的構造のより洗練された制御が望ましい。あるいは、粗い制御から生じるノイズの多いラベルに対処するために、不確実性推定手法[12, 57]をフレームワークに組み込むことができる。
統計
腹部セグメンテーションタスクにおいて、提案手法は、CTからMRIへの変換で86.20%、MRIからCTへの変換で90.17%という最高の平均Diceスコアを達成した。
腰椎セグメンテーションタスクにおいて、提案手法は、CTからMRIへの変換で3.13%、MRIからCTへの変換で4.03%という、以前の最良の結果を上回る結果を達成した。
肺セグメンテーションタスクにおいて、提案手法は、ベースラインと比べてDiceスコアで10%以上向上し、平均Diceスコア78.79%を達成した。これは、2番目に優れた手法(SLAug、68.01%)よりも10.78%高い数値である。
InfoNCE損失を用いない場合、平均Diceスコアは7.46%低下した。
KL-Div損失を用いた場合、InfoNCE損失を用いた場合と比べて、平均Diceスコアは3.63%低下した。
パッチ単位ではなく、画像全体の特徴を用いたInfoNCE損失を用いた場合、平均Diceスコアは4.56%低下した。
基本的なaugmentationのみを用いた場合、InfoNCE損失による平均Diceスコアの改善はわずか0.38%であった。
CSDG[40]で提案されているaugmentation手法と比較して、提案手法は平均Diceスコアで1.7%向上した。
DreamBooth[49]を用いたインスタンス微調整を行わない場合、平均Diceスコアは30.10%低下した。