المفاهيم الأساسية
提案するBFSeg フレームワークは、効率的で効果的な建物フットプリント抽出を実現する。密に接続されたコース-ファインフィーチャー融合デコーダーネットワークと、不純な領域を無視する寛容な深層監視および自己蒸留戦略により、高度な特徴抽出ネットワークを建物抽出タスクに効果的に適用できる。
الملخص
本論文は、高解像度リモートセンシング画像からの建物フットプリント抽出の効率化に取り組んでいる。
- 従来の建物抽出手法では、エンコーダー-デコーダー型アーキテクチャが広く採用されているが、デコーダー設計の非効率さと深層監視の課題が存在する。
- 提案するBFSeg フレームワークは以下の特徴を持つ:
- 軽量で効果的なデコーダーネットワーク(LightFPN)を提案し、高度な特徴抽出ネットワークを効率的に適用できる
- 深層監視時の不純な領域を無視する寛容な深層監視戦略を提案し、適切な領域からの学習を促進する
- 寛容な自己蒸留戦略を提案し、深層特徴の知識を浅層に効果的に伝達する
- 実験結果は、提案手法がWHU、DeepGlobe、中国典型都市の各データセットにおいて、高い精度と効率性を示すことを明らかにした。
الإحصائيات
提案手法BFSeg(ConvNeXt)はWHUデータセットでIoU 90.95%を達成し、従来手法より0.5%以上高い性能を示した。
BFSeg(ConvNeXt)はDeepGlobeデータセットでIoU 81.46%を達成し、従来手法より0.97%以上高い性能を示した。
BFSeg(ConvNeXt)は中国典型都市データセットでIoU 77.89%を達成し、従来手法より5.16%以上高い性能を示した。
اقتباسات
"従来のU-Net デコーダー設計は過剰な計算負荷をもたらし、高度な基盤ネットワークの優れた学習能力を十分に発揮できないという問題がある。"
"深層監視の際、下サンプリングされた ground truth の境界領域の不純性により、モデルの学習が困難になるという課題がある。"
"提案するBFSeg フレームワークは、軽量で効果的なデコーダーネットワークと寛容な深層監視・自己蒸留戦略を組み合わせることで、高度な特徴抽出ネットワークを建物抽出タスクに効果的に適用できる。"