核心概念
Spatial-Mambaは、従来の系列ベースの状態空間モデルを画像認識に効果的に適用するために、構造認識型状態融合モジュールを導入し、空間依存性を効率的に捉えることで、画像分類、物体検出、セマンティックセグメンテーションなどの視覚タスクにおいて優れたパフォーマンスを実現する。
要約
Spatial-Mamba: 構造認識型状態融合による効果的なビジュアル状態空間モデル
Xiao, C., Li, M., Zhang, Z., Meng, D., Zhang, L. (2024). SPATIAL-MAMBA: EFFECTIVE VISUAL STATE SPACE MODELS VIA STRUCTURE-AWARE STATE FUSION. arXiv preprint arXiv:2410.15091v1.
本論文は、従来の系列ベースの状態空間モデル(SSM)が画像認識において空間依存性の把握に苦労している点を克服し、画像認識に効果的なビジュアル状態空間モデルを提案することを目的とする。