Ein differenzierbares Modell, das explizit Konturen, Ecken und Knotenpunkte in Bildern unter hohem Rauschen lokalisiert, indem es einen Mechanismus der "Boundary Attention" verwendet.
Ein differenzierbares Modell, das explizit Konturen, Ecken und Kreuzungen in Bildern unter Verwendung eines Mechanismus der Konturaufmerksamkeit modelliert und vorhersagt.
Unser Modell nutzt einen neuartigen, beleuchtungsunabhängigen "physikalischen Vierfach-Prior", um Bilder bei schwacher Beleuchtung ohne Referenzbilder zu verbessern. Durch die Verwendung eines großen generativen Diffusionsmodells können wir die fehlenden Informationen aus dem Prior effektiv ergänzen.
Unser Modell CCC++ löst das Problem der Farbungleichgewichte in Bildern, indem es die Farbwerte in diskrete Farbklassen umwandelt, die Gewichtung der Farbklassen während des Trainings anpasst und eine objektselektive Farbharmonisierung mit Hilfe des Segment Anything Model (SAM) durchführt, um die Farbdarstellung zu verfeinern und zu verbessern.
Entwicklung eines innovativen Verfahrens zur automatischen Extraktion und Digitalisierung technischer Zeichnungen unter Verwendung von Deep-Learning-Methoden.
Durch die Nutzung der semantischen Informationen aus einem vortrainierten StyleGAN-Modell kann ein Skizzengenerator mit nur 16 Bildpaaren trainiert werden, um hochauflösende stilisierte Gesichtsskizzen aus Eingabebildern zu extrahieren.
Durch die Einführung eines bedingten erlernten Vorwerts in die Inferenzphase eines auf Flussmodellen basierenden Super-Auflösungsmodells können die inhärenten Probleme von Flussmodellen wie Gitterartefakte, explodierende Inverse und suboptimale Ergebnisse aufgrund einer festen Abtasttemperatur effektiv behoben werden.
IMPRINT, ein neuartiges zweistufiges Kompositionsmodell, zeichnet sich durch hervorragende Identitätserhaltung und nahtlose Hintergrundanpassung aus, indem es den Kompositionsprozess in die Teilaufgaben der Identitätserhaltung und der Hintergrundanpassung unterteilt.
Unser Modell kann historische astronomische Diagramme in einfache geometrische Primitive wie Linien, Kreise und Bögen zerlegen, indem es eine transformerbasierte Vektorisierungsmethode verwendet, die auf synthetischen Daten trainiert wird und auf einem herausfordernden Datensatz von 303 Diagrammen aus dem 12. bis 18. Jahrhundert genau arbeitet.