Beschleunigte Erlernung von Drehmoment-basierten Gehpolitiken für Roboter mit Beinen durch zerfallende Aktionspriors
Ein zweistufiger Ansatz, bei dem zunächst eine positionsbasierte Politik trainiert wird, um Imitationsdaten zu gewinnen, und dann "zerfallende Aktionspriors" verwendet werden, um die Erkundung des Drehmomentbereichs zu beschleunigen und eine konsistente Konvergenz zu natürlichen Gehbewegungen zu erreichen.