Die vorgeschlagene Methode besteht aus einem gemeinsamen Lernrahmen für Segmentierungs- und Bildergänzungsnetzwerke zur Objektentfernung. Die beiden Netzwerke werden gemeinsam trainiert, so dass die vom Segmentierungsnetzwerk extrahierten Objektmasken für die Bildergänzungsaufgabe optimiert werden. Darüber hinaus erweitert der vorgeschlagene Maskenerweiterungsverlust die Maske minimal, um den Objektbereich abzudecken.
Im Trainingsprozess werden Bildpaare mit und ohne überlagerte Objektregionen generiert, um die Lücke zwischen den Masken im Training und in der Inferenz zu überbrücken. Das Segmentierungsnetzwerk und das Bildergänzungsnetzwerk werden dann in einem End-to-End-Verfahren trainiert, um die Objektmaske für eine bessere Bildergänzung zu optimieren.
Die experimentellen Ergebnisse zeigen, dass die vorgeschlagene Methode die Qualität der Objektentfernung durch Bildergänzung im Vergleich zu state-of-the-art-Methoden deutlich verbessert.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Kodai Shimos... في arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15849.pdfاستفسارات أعمق