Die vorgeschlagene Methode besteht aus einem gemeinsamen Lernrahmen für Segmentierungs- und Bildergänzungsnetzwerke zur Objektentfernung. Die beiden Netzwerke werden gemeinsam trainiert, so dass die vom Segmentierungsnetzwerk extrahierten Objektmasken für die Bildergänzungsaufgabe optimiert werden. Darüber hinaus erweitert der vorgeschlagene Maskenerweiterungsverlust die Maske minimal, um den Objektbereich abzudecken.
Im Trainingsprozess werden Bildpaare mit und ohne überlagerte Objektregionen generiert, um die Lücke zwischen den Masken im Training und in der Inferenz zu überbrücken. Das Segmentierungsnetzwerk und das Bildergänzungsnetzwerk werden dann in einem End-to-End-Verfahren trainiert, um die Objektmaske für eine bessere Bildergänzung zu optimieren.
Die experimentellen Ergebnisse zeigen, dass die vorgeschlagene Methode die Qualität der Objektentfernung durch Bildergänzung im Vergleich zu state-of-the-art-Methoden deutlich verbessert.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Kodai Shimos... om arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15849.pdfDiepere vragen