本研究では、自律型表面船舶の安全な航行を実現するため、強化学習と予測安全フィルタを組み合わせた手法を提案している。
まず、船舶の3自由度モデルを使用して船舶の運動学と動力学を表現する。次に、環境からの外乱を推定するための非線形外乱オブザーバを導入する。
強化学習エージェントは、経路追従とコリジョンアボイダンスのタスクを学習する。一方、予測安全フィルタは、強化学習エージェントが提案した操縦指令を修正し、物理的および安全上の制約を満たすよう最小限の変更を行う。
予測安全フィルタは、現在の状態と強化学習エージェントの提案操縦指令を基に、一定の予測期間における安全な軌道を計算する。この最適化問題を解くことで、制約を満たしつつ提案操縦指令に近い操縦指令を出力する。
最終的に、修正された操縦指令が船舶モデルに入力され、シミュレーション上で評価される。実験の結果、予測安全フィルタにより、強化学習エージェントの安全性が確保されつつ、学習速度や性能の低下も抑えられることが示された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Aksel Vaaler... at arxiv.org 04-03-2024
https://arxiv.org/pdf/2312.01855.pdfDeeper Inquiries