Core Concepts
VMambaMorphは、視覚的Mambaモデルを用いた3D画像登録のための新しいハイブリッドネットワークである。従来のCNNベースの手法や注意機構ベースの手法に比べ、効率的な計算コストでグローバルな依存関係をモデル化することができる。
Abstract
本論文では、視覚的Mambaモデル(VMamba)を医療画像登録に適用した新しいフレームワークVMambaMorphを提案している。VMambaMorphは、2つのブランチからなる特徴抽出モジュール、登録モジュール、空間変換ネットワークで構成される。
登録モジュールでは、3D volumetric特徴処理のためにVSSブロックを再設計し、CNNベースのU字型ネットワークに統合している。また、高次元特徴学習のために、効率的かつ単純な特徴抽出器を利用している。
公開ベンチマークデータセットMR-CTを用いた評価では、VMambaMorphが既存の最先端手法を上回る登録精度を達成することを示している。特に、Dice係数では16%、95%ハウスドルフ距離では6%、非正のヤコビアン行列の割合では1%の改善が確認された。
さらに、特徴抽出器の有無による実験から、特徴抽出器の導入が全ての手法の性能を向上させることが分かった。VMambaMorphは最も安定した学習過程を示し、優れた一般化性能を有することが確認された。
Stats
初期状態のDice係数は62.42±3.29%、95%ハウスドルフ距離は3.73±0.41voxel
VMambaMorphのDice係数は82.49±1.99%、95%ハウスドルフ距離は1.38±0.18voxel