Stabile Diffusion-Modell durch Belohnungsoptimierung für die Erzeugung komplexer, unbekannter Bilder verbessert
Die vorgeschlagene Methode PRDP ermöglicht erstmals eine stabile Belohnungsoptimierung für Diffusionsmodelle auf großen Datensätzen mit über 100.000 Prompts, was zu einer deutlich verbesserten Bildqualität auf komplexen, unbekannten Prompts führt.