Die Studie befasst sich mit dem Problem der unüberwachten Bildübersetzung, bei dem die Darstellung eines Objekts oder einer Szene in eine andere umgewandelt oder gezwungen wird. In den letzten Jahren wurden diese Aufgaben mit überwachten Lernmethoden durchgeführt, die eine große Anzahl von gekennzeichneten Datensätzen von passenden Bildpaaren erfordern. In der Praxis ist die Verfügbarkeit solcher Datensätze sehr gering oder sogar nicht vorhanden.
Die Autoren untersuchen einige Versagensfälle eines wegweisenden Werks in diesem Bereich, CycleGAN, und vermuten, dass sie mit der Stabilität von GANs zusammenhängen. Sie schlagen zwei allgemeine Modelle vor, um diese Probleme zu lindern. Sie kommen auch zu dem Schluss, dass das Problem der unüberwachten Bildübersetzung, wenn es unterbestimmt ist, schlecht gestellt ist und viele willkürliche Zuordnungen möglich sind, die die Zyklusbedingungen erfüllen.
Das 1-GAN-Modell verwendet einen Wasserstein-GAN-Ansatz mit einer Architektur, die darauf abzielt, die Instabilität und den Modenkollaps von GANs zu reduzieren. Das GAN-freie Modell nutzt stattdessen variationelle Autoencoder, um die Quell- und Zieldomänenverteilungen zu modellieren, und erzwingt eine Zyklusbedingung, um die Übersetzung über Domänen hinweg durchzuführen.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by BahaaEddin A... om arxiv.org 03-18-2024
https://arxiv.org/pdf/2403.09646.pdfDiepere vragen