Effiziente Navigation in teilweise beobachtbaren Umgebungen durch wertgeleitete Diffusions-Politik
Eine wertgeleitete Diffusions-Politik, die Aktionssequenzen für die Navigation in komplexen, teilweise beobachtbaren Umgebungen generiert, übertrifft bestehende autoregressive und diffusionsbasierte Methoden.