本研究は、ロボット操作における動的システムの同定に取り組む。従来のモデルフリーな強化学習手法は、サンプル効率が低いという課題がある。一方、モデルベースの手法は、高精度なシミュレーションモデルを要するという課題がある。
本研究では、ASID (Active Exploration for System IDentification)と呼ばれる手法を提案する。ASIDは以下の3つのステップから成る:
シミュレーション上で、フィッシャー情報量を最大化する探索戦略を学習する。これにより、実世界の未知のパラメータを効率的に同定できる。
実世界で探索戦略を実行し、得られたデータを用いてシミュレーションモデルのパラメータを同定する。
同定されたパラメータを用いて、シミュレーション上で目標タスクの最適な制御戦略を学習し、実世界に転移する。
実験では、ボールの操作、ロッドのバランス、ラップトップの関節構造の同定などの課題に適用し、少量の実世界データでも高い性能を示すことを確認した。ASIDは、ロボット操作における動的システムの同定と制御の実現に有効な手法である。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Marius Memme... kl. arxiv.org 04-19-2024
https://arxiv.org/pdf/2404.12308.pdfDybere Forespørgsler