核心概念
医用画像セグメンテーションにおけるドメインシフト問題に対処するため、本論文では、ドメイン内空間の探索とドメイン外サンプルの生成を同時に行う新しいデータ拡張手法である「適応型特徴ブレンド(AFB)」と、ドメイン不変表現の学習をガイドするプラグアンドプレイモジュールである「デュアル相互注意正則化(DCAR)」を提案する。
要約
ドメイン汎化のための新しい医用画像セグメンテーション手法
本論文は、医用画像セグメンテーションにおけるドメイン汎化のための新しいパラダイムを提案する研究論文である。
本研究は、異なる医療機関や機器からの医用画像データにおけるドメインシフト問題に対処し、未知のターゲットドメインにおいても高いセグメンテーション精度を実現することを目的とする。
本論文では、2つの主要な手法を提案している。
1. 適応型特徴ブレンド (AFB)
CNN特徴量の統計情報、特に特徴マップのチャネル平均と標準偏差が、スタイル化された画像の特性を効果的に捉え、視覚ドメインの表現とみなせるという知見に基づく。
ソースドメインインスタンスのスタイル情報を摂動させることで、CNNトレーニングを正規化する。
具体的には、ドメイン内空間をカバーし、ドメイン外サンプルを生成するために、ほとんどの特徴統計量を含む一様分布からランダムに拡張統計量をサンプリングする。
拡張された統計量と元の統計量をチャネルに沿って混合し、混合された特徴統計量を正規化された特徴に適用して摂動させる。
この手法は、MixStyleと比較して、ドメイン外サンプルを生成することでトレーニングデータの多様性を大幅に向上させる。さらに、元の機能からの参照を組み込むことで、過剰なランダム化によるモデルの過剰適合や収束の失敗を防ぐことができる。
2. デュアル相互注意正則化 (DCAR)
AFB適用後、異なるスタイルだが同じセマンティクスを持つ、元の深層特徴と生成された深層特徴を得る。
モデルがより多くのドメイン不変表現を学習できるように、注意機構の長期依存性を利用する。
生成された深層特徴の意味情報を活用し、クロスチャネル注意機構を適用して、元の深層特徴をロバストな正則化表現に再構築する。
具体的には、元の深層特徴をクエリとして使用し、生成された深層特徴をキーとバリューとして使用する。
元の深層特徴と生成された深層特徴の各チャネル間の類似度を計算し、生成された深層特徴の最も類似したチャネルが、元の深層特徴の再構築においてより重要な役割を果たすようにする。
これは、元の深層特徴をクエリとして使用して、クロスドメインで生成された深層特徴表現の一貫性を強制することで表示制約を形成し、それによってモデルがドメイン不変表現を学習するように促す。
同様に、クロスドメインで生成された深層特徴をクエリとして使用して、元の深層特徴表現の一貫性を強制することで、表示制約を適用することもできる。
最後に、再構築された特徴と自己注意された元の特徴を融合してデコーダに入力し、最終的な予測を生成する。生成された特徴も同じプロセスを経る。