Core Concepts
ゲームプレイベースの安全フィルタは、高次元の非線形ロボット動力学に対して、シミュレーションとの差異や外乱に対して頑健な安全性を維持する。
Abstract
本論文は、ロボットの安全な歩行を実現するためのゲームプレイベースの安全フィルタを提案している。
オフラインでは、ゲーム理論に基づく強化学習を用いて、ロボットの制御ポリシーと攻撃的な外乱ポリシーを同時に学習する。これにより、シミュレーションとの差異や外乱に対して頑健な安全性を持つ制御ポリシーを得る。
オンラインでは、学習した制御ポリシーと外乱ポリシーを用いて、ロボットの現在の状態から想定される最悪の未来を迅速にシミュレーションし、安全性を評価する。危険な状況が予測された場合、安全フィルタが制御入力を介入して、ロボットの転倒を防ぐ。
36次元の状態空間を持つ4脚ロボットの歩行タスクで検証した結果、提案手法は、外乱に対して高い頑健性を示し、タスク遂行を大幅に阻害することなく安全性を維持できることが示された。実機実験では、引っ張り力や不整地での歩行でも高い安全性を発揮した。
Stats
提案手法は、36次元の状態空間と12次元の制御入力空間を持つ4脚ロボットの歩行タスクに適用された。
外乱入力は6次元で、最大50Nの引っ張り力を表現した。
Quotes
"ゲームプレイベースの安全フィルタは、シミュレーションとの差異や外乱に対して頑健な安全性を維持する。"
"提案手法は、タスク遂行を大幅に阻害することなく安全性を維持できる。"