Der Artikel präsentiert ein effizientes Gebäudeextrationsframework namens BFSeg, das zwei Hauptherausforderungen bei der Übertragung von Bildverarbeitungsmodellen auf Fernerkundungsaufgaben adressiert:
Featureintegration: BFSeg führt ein leichtes und effektives Decoder-Netzwerk namens LightFPN ein, das eine nahtlose Übertragung von fortschrittlichen Encoder-Netzwerken wie ConvNeXt und Swin Transformer auf die Gebäudeextraktion ermöglicht. LightFPN ermöglicht eine effiziente Verfeinerung von Gebäudeprognosen in einer grob-zu-fein-Weise.
Modelllernen: BFSeg präsentiert eine nachsichtige Tiefenüberwachungs- und Destillationsstrategie, um das Problem des ungültigen Lernens an Objektgrenzen aufgrund ungenauer heruntergesampelter Bodenwahrlabels zu lösen. Die Strategie ermöglicht dem Modell, effektiv aus reinen Regionen zu lernen und so die Leistung zu verbessern.
Experimente auf drei großen Gebäudedatensätzen zeigen, dass BFSeg die Leistung und Effizienz bestehender Methoden deutlich übertrifft, indem es die Stärken fortschrittlicher Backbone-Netzwerke voll ausschöpft.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Haonan Guo,B... um arxiv.org 04-11-2024
https://arxiv.org/pdf/2307.12220.pdfTiefere Fragen