本稿では、従来のCNNやTransformerベースのモデルと比較して、3D医療画像セグメンテーションにおいて、線形時間計算量で長距離依存性を効率的にモデル化できるState Space Model(SSM)ベースのMambaアーキテクチャが優れた性能を発揮することを示します。
本研究では、3D空間の特徴を効果的に捉えるGASAブロックを提案し、U-Netベースのモデルに統合することで、医療画像のセグメンテーション性能を向上させた。
SegMambaは、3D医療画像の全体的な特徴をさまざまなスケールでモデル化することで、長距離依存関係を効率的にキャプチャできる新しいフレームワークである。
UNETR++は、空間的および特徴量間の相互依存性を効率的に学習することで、高精度かつ効率的な3D医療画像セグメンテーションを実現する。
SegFormer3Dは、大規模なTransformerモデルと同等の性能を示しながら、パラメータ数と計算量を大幅に削減した軽量な3D医療画像セグメンテーションモデルである。
3D医療画像セグメンテーションにおいて、適切に設定されたU-Netアーキテクチャでも最先端の結果を達成できることが示されたにもかかわらず、新しいアーキテクチャの追求と、U-Netベースラインを上回る性能の主張が続いている。しかし、多くの最近の主張は、不適切なベースラインの使用、不十分なデータセット、無視された計算リソースなどの一般的な検証の欠陥に直面すると成り立たないことが明らかになった。
提案された手法は、3D医療画像セグメンテーションにおいて高い訓練安定性とデータ効率を持つ最先端の3Dニューラルネットワークを超える。