本論文では、SAFE-GIL(SAFEty Guided Imitation Learning)と呼ばれる新しい模倣学習手法を提案している。従来の模倣学習手法は、専門家の行動を単純に模倣するため、状態の偏りが生じ、危険な状態への遷移を引き起こす可能性がある。SAFE-GILでは、ハミルトン・ヤコビ可到達性解析を用いて、安全上重要な状態を特定し、それらの状態に意図的にロボットを誘導することで、安全性の高い制御政策を効率的に学習する。
具体的には以下の手順で行う:
実験では、屋内移動ロボットと航空機の自動操縦の2つのタスクで提案手法の有効性を示している。提案手法は、少ない専門家の行動データでも高い成功率を達成できることを示しており、特に安全性が重要な応用分野で有効であることが分かる。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yusuf Umut C... at arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05249.pdfDeeper Inquiries