Keskeiset käsitteet
本稿では、外乱を受ける状況下でも安全性を確保しながらマルチコプターに軌跡追跡を学習させるための、安全強化学習フィルター(SRLF)を提案する。
Tiivistelmä
安全強化学習フィルター(SRLF)を用いた、外乱下におけるマルチコプターの衝突回避追跡
本論文は、外乱を受ける状況下でも安全性を確保しながらマルチコプターに軌跡追跡を学習させるための、安全強化学習フィルター(SRLF)を提案する研究論文である。
外乱の影響を受けやすい、現実世界におけるマルチコプターの安全な軌跡追跡制御の実現。
従来の安全学習手法における、報酬最大化と安全コスト最小化のトレードオフによる学習の不安定性の解消。
ロバスト制御バリア関数(RCBF):外乱下でも安全集合の順不変性を保証するよう設計された、安全性を確保するための関数。
安全フィルター:任意のモデルフリー強化学習アルゴリズムによって生成された、安全性を考慮しない制御入力に対して、RCBFに基づいて安全性を満たすように補正を加えるフィルター。
二次計画問題(QP):RCBFの順不変性と入力飽和制約を考慮した最適化問題として定式化し、安全性を保証する制御出力を算出。