Effiziente Selbsterkundung in tiefen Verstärkungslernumgebungen durch ein variationelles dynamisches Modell
Ein variationelles dynamisches Modell, das die Multimodalität und Stochastik der Umgebungsdynamik explizit modelliert, ermöglicht eine effiziente Selbsterkundung in Verstärkungslernaufgaben ohne extrinsische Belohnungen.