この論文では、構成可能な制御問題に対する新しい強化学習手法である、Feudal Graph Reinforcement Learning (FGRL) が提案されています。FGRLは、階層強化学習とピラミッド型のメッセージパッシングアーキテクチャを組み合わせたものです。
従来のグラフベースの強化学習手法では、メッセージパッシングが局所的に行われるため、情報ボトルネックが発生し、大域的な協調が阻害される可能性がありました。特に、高度な計画を必要とするタスクでは、この問題が深刻化します。
FGRLは、階層的なポリシー構造とメッセージパッシングを組み合わせることで、この問題に対処します。具体的には、FGRLは、上位レベルのコマンドが階層化されたグラフ構造を介して下位レベルに伝播される、階層的なポリシー構造を定義します。最下層は物理システムの構造を模倣し、上位層はより高次のサブモジュールに対応します。
各階層レベルのポリシーは、下位レベルの目標を設定することで、階層的な意思決定構造を実現します。これにより、タスクの分解が自然に行われ、複雑な制御問題を効率的に学習することができます。
論文では、グラフクラスタリング問題とMuJoCoロコモーションタスクを用いて、提案されたフレームワークの評価が行われています。シミュレーションの結果、FGRLは関連するベースラインと比較して優れた性能を示すことが示されています。さらに、コマンド伝播メカニズムの詳細な分析により、導入されたメッセージパッシングスキームが階層的な意思決定ポリシーの学習を促進することが明らかになっています。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Tommaso Marz... klokken arxiv.org 10-15-2024
https://arxiv.org/pdf/2304.05099.pdfDypere Spørsmål