Conceptos Básicos
本稿では、ロボット学習におけるシミュレーションと現実世界の差異を埋めるために、微分可能シミュレーション内で情報量の多い接触モードを積極的に計画・励起する手法を提案する。
Resumen
微分可能シミュレーションにおける接触モードの活用
本稿は、CoRL 2024 Workshop 'Differentiable Optimization Everywhere' に提出された論文 "Exciting Contact Modes in Differentiable Simulations for Robot Learning" の要約です。
本研究は、ロボット学習におけるシミュレーションと現実世界の差異 (sim-to-real gap) を縮小するために、微分可能シミュレーションにおいて、情報量の多い接触モードを積極的に計画・励起する手法を提案することを目的としています。
本研究では、接触を伴う最適な実験計画アプローチを提案しています。このアプローチは、情報理論に基づいており、接触を考慮したフィッシャー情報量を最大化する接触モードを、接触陰的最適化を用いて特定・探索します。
具体的には、以下の手順でシミュレーションとパラメータ学習を行います。
ロボットの動作を微分可能シミュレーション上で実行し、センサーデータを取得します。
取得したセンサーデータとロボットの運動方程式を用いて、接触を考慮したフィッシャー情報量を計算します。
フィッシャー情報量が最大となるように、接触モードを最適化します。
最適化された接触モードを用いて、ロボットの制御パラメータを学習します。