Personalisierte und disentangelte Text-zu-Bild-Generierung durch Aufmerksamkeitssteuerung
Unser Verfahren DisenDiff kann multiple, neuartige Konzepte aus einem einzigen Referenzbild erlernen und diese in verschiedenen Kontexten und Kombinationen synthetisieren, ohne dabei die visuelle Ähnlichkeit zum Eingabebild zu verlieren.