Effiziente Generierung von Lösungen mit hoher Belohnung durch datengesteuerte Optimierung mit Diffusionsmodellen
Durch die Umformulierung des Optimierungsproblems in ein bedingtes Stichprobenziehungsproblem können Diffusionsmodelle effizient für die Generierung von Lösungen mit hoher Belohnung genutzt werden. Der Schlüssel liegt darin, ein belohnungsgesteuertes, bedingtes Diffusionsmodell zu trainieren, um Lösungen mit hoher vorhergesagter Belohnung zu erzeugen.