Core Concepts
ロボットマニピュレータの軌道計画における深層決定方策勾配(DDPG)アルゴリズムの実装と効率性比較。
Abstract
この研究は、マニピュレータの軌道計画に強化学習アルゴリズムを実装することに焦点を当てています。7自由度のロボットアームを使用して、ランダムな場所に配置されたブロックをランダムな目標地点に運ぶことが目的です。障害物はランダムに移動し、オブジェクトを取る際に障害物となります。主な課題は未知のダイナミクスや操作空間内での障害物の移動といった要素です。
技術概要:
ロボット操作空間内で障害物回避しながらタスクを実行するための軌道計画。
ロボットアームの関節速度を最小限に抑えつつ衝突フリーなタスク遂行。
深層決定方策勾配(DDPG)アルゴリズムを使用したトラジェクトリプランニング。
実験結果:
ガウス過程雑音を含めた行動値生成方法。
DDPGフレームワークでロボットマニピュレータ用トラジェクトリプランニング。
疎報酬と密報酬による成功率比較。
未来への展望:
動的グラフ上で障害物が出現する問題への対応方法。
モデル予測制御(MPC)と強化学習(RL)組み合わせた経路計画応用。
Stats
"The timestamp to accomplish the task per episode is set to T = 100."
"The success rate with sparse and dense rewards is shown in Fig. 7."
"Each model was trained using the Adam optimizer and the hyperparameters used for experimentation mentioned in the Appendix."
Quotes
"Artificial potential fields are also used to avoid obstacles in the operative space of the manipulator."
"In this literature, two major control techniques have been discussed: low-dimensionality and raw pixels using deep deterministic policy gradient (DDPG)."
"The convergence will occur in fewer iterations compared to the other approaches."