核心概念
点アノテーションを用いて、セグメントエニシングモデルをリモートセンシング画像に適応させ、高精度なセグメンテーションを実現する。
摘要
本研究では、セグメントエニシングモデル(SAM)をリモートセンシング画像(RSI)に適応させる手法を提案している。RSIはナチュラル画像とは大きく異なる特徴を持つため、従来のSAMを直接適用するだけでは性能が低下する。そこで本研究では、点アノテーションを用いた自己教師学習フレームワークを提案する。
具体的には以下の2つの手法を導入している:
- プロトタイプベース正則化(PBR):
- 事前にターゲットデータのプロトタイプを抽出し、予測プロトタイプとのマッチングを行うことで、自己教師学習の誤りの蓄積を防ぐ。
- 負のプロンプト調整(NPC):
- RSIでは密集した物体や背景との類似性が高いため、単一の点プロンプトでは複数の物体を1つのマスクとして認識してしまう。
- 重複するマスクを検出し、それらの点プロンプトを負のプロンプトとして利用することで、より精度の高いマスクを生成する。
これらの手法を組み合わせた点監督セグメントエニシングモデル(PointSAM)を提案し、NWPU VHR-10、WHU、HRSID-inshoreの3つのRSIデータセットで評価を行った。その結果、従来手法と比較して大幅な性能向上を示した。さらに、PointSAMを点ベースの物体検出タスクにも適用し、良好な結果を得た。
统计
RSIは従来のナチュラル画像と大きく異なる特徴を持つため、直接SAMを適用すると20%以上の性能低下が見られる。
提案手法PointSAMは、NWPU VHR-10で最大31%、WHUで最大9%、HRSID-inshoreで最大34%の性能向上を達成した。
引用
"RSIはナチュラル画像とは大きく異なる特徴を持つため、従来のSAMを直接適用するだけでは性能が低下する。"
"点アノテーションを用いた自己教師学習フレームワークを提案し、プロトタイプベース正則化とネガティブプロンプト調整を導入することで、大幅な性能向上を実現した。"