Die vorgeschlagene Bidirektionale mehrstufige Domänengeneralisierung (BMDG) erstellt mehrere virtuelle Zwischendomänen, indem sie diskriminative und komplementäre Körperteilprototypen aus beiden Modalitäten findet und aufeinander abstimmt. Dadurch wird die Diskrepanz zwischen den Modalitäten schrittweise reduziert, um eine robuste und modalitätsunabhängige Merkmalsdarstellung für die Personenwiederidentifizierung zu erlernen.
Das Hauptproblem der unüberwachten Bildübersetzung ist, dass es viele mögliche willkürliche Zuordnungen gibt, die die Zyklusbedingungen erfüllen, da das Problem unterbestimmt ist. Die vorgeschlagenen Modelle versuchen, dieses Problem durch verschiedene Ansätze zu lösen, wie z.B. den Einsatz von Wasserstein-GANs oder variationellen Autoencodern.
Durch den Einsatz eines Diffusionsmodellrahmens können wir die Posteriorverteilung der Kleinzielmasken generativ modellieren und so die Leistungsgrenze der diskriminativen empirischen Risikominimierung überwinden.