Core Concepts
Unser Modell CCC++ löst das Problem der Farbungleichgewichte in Bildern, indem es die Farbwerte in diskrete Farbklassen umwandelt, die Gewichtung der Farbklassen während des Trainings anpasst und eine objektselektive Farbharmonisierung mit Hilfe des Segment Anything Model (SAM) durchführt, um die Farbdarstellung zu verfeinern und zu verbessern.
Abstract
Das Papier stellt eine Methode zur automatischen Kolorierung von Graustufenbildern vor, die als CCC++ bezeichnet wird. Die Kernpunkte sind:
Transformation der kontinuierlichen Farbwerte in diskrete Farbklassen, um das Problem des Farbungleichgewichts anzugehen. Es werden 532 Farbklassen verwendet, die auf Basis der tatsächlichen Farbverteilung in Echtzeit-Bildern optimiert wurden.
Einführung einer klassengewichteten Verlustfunktion, um die Beiträge der seltener auftretenden Farbklassen zu erhöhen und so eine ausgewogenere Farbverteilung zu erreichen. Dabei wird ein Hyperparameter verwendet, um den optimalen Kompromiss zwischen häufigen und seltenen Farbklassen zu finden.
Vorstellung einer neuartigen objektselektiven Farbharmonisierungsmethode, die vom Segment Anything Model (SAM) unterstützt wird, um die Farbdarstellung an den Objektkanten zu verfeinern und zu verbessern.
Einführung zweier neuer Metriken zur Bewertung der Farbqualität: Color Class Activation Ratio (CCAR) und True Activation Ratio (TAR).
Die Ergebnisse zeigen, dass das CCC++-Modell den aktuellen Stand der Technik in Bezug auf Visualisierung, Kontrastnorm und die neu eingeführten Metriken übertrifft, während es bei anderen gängigen Bewertungskriterien wie MSE, PSNR, SSIM, LPIPS und FID gute Leistungen erbringt.
Stats
Die Farbwerte werden in 532 Farbklassen eingeteilt, die auf Basis der tatsächlichen Farbverteilung in Echtzeit-Bildern optimiert wurden.
Der Hyperparameter Ψ wird verwendet, um den optimalen Kompromiss zwischen häufigen und seltenen Farbklassen zu finden.
Quotes
"Unser Modell CCC++ löst das Problem der Farbungleichgewichte in Bildern, indem es die Farbwerte in diskrete Farbklassen umwandelt, die Gewichtung der Farbklassen während des Trainings anpasst und eine objektselektive Farbharmonisierung mit Hilfe des Segment Anything Model (SAM) durchführt, um die Farbdarstellung zu verfeinern und zu verbessern."
"Wir führen zwei neue Metriken zur Bewertung der Farbqualität ein: Color Class Activation Ratio (CCAR) und True Activation Ratio (TAR)."