本論文は、リモートセンシング画像の意味論的セグメンテーションタスクに取り組むための新しいネットワークモデルPPMambaを提案している。
PPMambaの核となる構造はPP-SSMブロックで、これはCNNベースのピラミッド プーリング補助メカニズムとオムニ方向状態空間モデル(OSS)を組み合わせている。
ピラミッド型の畳み込みブロックにより、多様なスケールの局所的特徴を抽出することができ、OSSによって全方位的な長距離依存関係をモデル化することができる。
これにより、PPMambaは局所的な詳細情報と大域的なコンテキスト情報の両方を効果的にキャプチャできる。
実験では、ISPRS VaihingenデータセットとloveDa Urbanデータセットで評価を行い、提案手法が既存の最先端モデルを上回る性能を示すことを確認した。
特に、建物の境界線や樹木、低い植生領域の識別において優れた結果を得ている。
また、計算量の分析から、PPMambaは効率的な推論速度を維持しつつ、高い精度を達成できることが示された。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Yin Hu, Xian... lúc arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06309.pdfYêu cầu sâu hơn