本研究は、都市景観画像の移動物体除去のための新しい深層ニューラルネットワークモデルを提案している。
主な特徴は以下の通り:
多重スケールのセマンティック事前特徴を学習するための「セマンティック事前prompter」と、これらの事前特徴を適応的に画像特徴と融合する「セマンティック強化画像生成器」から成る二重のエンコーダ-デコーダアーキテクチャを採用している。
事前学習モデルからの知識を活用することで、グローバルなコンテキストを理解し、合理的な構造と詳細なテクスチャを持つ画像を生成できる。
背景を意識したデータ処理パイプラインを採用し、生成器が穴の中に新しいオブジェクトを合成するのを防いでいる。
ベンチマークデータセットでの実験結果から、提案手法が既存手法に比べて優れた性能を示すことが確認された。特に、大規模な欠損領域を含む画像に対して高い修復能力を発揮している。
専門家による主観的な評価でも、提案手法が最も信頼性の高い結果を生成することが示された。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Jianshun Zen... alle arxiv.org 09-20-2024
https://arxiv.org/pdf/2405.10504.pdfDomande più approfondite