本稿では、傾斜航空画像から正確なポリゴン状の建物フットプリントを抽出する、プロンプト可能かつエンドツーエンドなモデルOBMv2を提案する。OBMv2は、オフセット予測を強化するSelf Offset Attention (SOFA) メカニズム、複数ソースの情報を活用するMulti-level Information System (MISS)、そしてポリゴン状の結果を直接出力する頂点トークンとDynamic Scope Binary Cross Entropy Loss (DS-BCE Loss) を導入することで、従来手法の精度と効率を大幅に向上させる。
提案するBFSeg フレームワークは、効率的で効果的な建物フットプリント抽出を実現する。密に接続されたコース-ファインフィーチャー融合デコーダーネットワークと、不純な領域を無視する寛容な深層監視および自己蒸留戦略により、高度な特徴抽出ネットワークを建物抽出タスクに効果的に適用できる。