提案するDecAP(Decaying Action Priors)フレームワークは、位置ベースの学習の効率性を活用して、トルク空間での学習を大幅に高速化する。これにより、トルク制御ポリシーが高品質な歩容を短時間で獲得し、外乱に対する頑健性を発揮する。