Core Concepts
事前ドメイン知識を活用して、観測データと事前モデルの不一致が最大となる領域を重点的に探索することで、効率的に動力学を学習する。
Abstract
本論文では、事前ドメイン知識を活用した能動的な動力学学習手法を提案している。
事前ドメイン知識に基づく不完全な動力学モデルを利用し、観測データとの不一致が最大となる領域を重点的に探索する。
これにより、データ効率的に動力学を学習できる。
エピソード単位で行動系列を最適化し、各ステップで観測データと事前モデルの差異を最大化するように行動を選択する。
提案手法は理論的に一致性を持つことを示し、単振り子システムおよび半チーターMuJoCo環境での実験で有効性を確認した。
Stats
動力学モデルの真値と事前モデルの差異が大きい領域ほど、より多くのデータを収集する必要がある。
動力学モデルの予測分散が大きい領域ほど、より多くのデータを収集する必要がある。
Quotes
"事前ドメイン知識を活用して、観測データと事前モデルの不一致が最大となる領域を重点的に探索することで、効率的に動力学を学習する。"
"提案手法は理論的に一致性を持つことを示し、単振り子システムおよび半チーターMuJoCo環境での実験で有効性を確認した。"