本研究は、強化学習(RL)エージェントの2次元(2D)および3次元(3D)環境における性能を探索することを目的としている。ライブラリを使用せずに数学的モデリングのみで開発されたアルゴリズムを用いて、空間次元の違いがエージェントの学習と適応にどのような影響を及ぼすかを調査した。
2D環境では、エージェントは訓練を重ねるにつれて、目標地点への効率的な移動経路を学習していった。一方、3D環境では、追加の次元性によって複雑性が高まるものの、エージェントは高い効率で目標地点に到達することができた。
この結果は、強化学習アルゴリズムが複雑な多次元空間においても有効に機能することを示している。ただし、2Dから3Dへの移行では学習の安定化に必要なエピソード数が大幅に増加しており、高次元環境での学習動態の理解が今後の課題として浮かび上がった。
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Ergon Cugler... о arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18219.pdfГлибші Запити