核心概念
MambaRegは、マルチモーダル画像レジストレーションにおいて、位置合わせに寄与する特徴と寄与しない特徴を分離することで、従来手法よりも高精度なレジストレーションを実現する。
研究目的
本論文では、異なるモダリティの画像を空間的に位置合わせする、マルチモーダル画像レジストレーション (MIR) における課題、特に、大きな位置ずれや、位置合わせに寄与しない特徴の存在といった課題に取り組むことを目的とする。
手法
本論文では、Mambaベースのマルチモーダル画像レジストレーションネットワークであるMambaRegを提案する。MambaRegは、2つの相互作用するブランチで構成され、提案するモジュールによって、異なるモダリティから位置合わせに寄与する特徴と寄与しない特徴を分離する。長距離依存性を活用するために、Mambaの長シーケンスモデリング機能をモデルに統合する。具体的には、Modality-Dependent Feature Extractor (MDFE)、Modality-Invariant Feature Extractor (MIFE)、Mamba-based Multi-Modal Registration Module (M3RM) の3つのモジュールから構成される。MDFEは、各モダリティから位置合わせに寄与しない特徴を抽出し、MIFEは、位置合わせに寄与する特徴を抽出して再構成する。M3RMは、再構成された特徴を入力として、レジストレーションフィールドを予測する。
実験結果
提案手法を評価するために、公開されているMSU-PIDデータセットに基づいて、非剛体RGB-IR植物画像データセットを再構築した。このデータセットを用いて、従来手法との比較実験を行った結果、MambaRegは、レジストレーション精度において、従来手法を上回る性能を達成した。
結論
本論文で提案したMambaRegは、マルチモーダル画像レジストレーションにおいて、位置合わせに寄与する特徴と寄与しない特徴を分離することで、従来手法よりも高精度なレジストレーションを実現できることを示した。
統計
訓練データセットには12,275組の画像ペアを使用し、そのうち300組をランダムに選択して訓練に使用した。
テストデータセットには1,633組の画像ペアを使用し、そのうち900組をランダムに選択してテストに使用した。
MambaRegは、Diceスコア、平均二乗誤差 (MSE)、正規化相互相関係数 (NCC)、SSIMのすべての指標において、従来手法を上回る性能を達成した。