Core Concepts
本研究では、高次元偏微分方程式の状態を効率的に推定するために、低次元の簡略化モデルと強化学習を組み合わせた新しい手法を提案する。この手法では、簡略化モデルに基づいて構築された推定器の補正項を、強化学習によって訓練された非線形ポリシーで与えることで、簡略化モデルの誤差を効果的に補償する。
Abstract
本研究では、偏微分方程式で記述される高次元非線形システムの状態推定問題に取り組む。
まず、高次元システムの簡略化モデル(ROM)を構築する。次に、ROMに基づいて設計された推定器(ROE)の補正項を、強化学習によって訓練された非線形ポリシーで与える新しい手法(RL-ROE)を提案する。
RL-ROEは以下の特徴を持つ:
ROMの誤差を非線形ポリシーで効果的に補償できる
少数のセンサーデータでも高精度な状態推定が可能
未知の物理パラメータに対しても頑健な推定性能を発揮する
具体的には、バーガーズ方程式とナビエ・ストークス方程式の数値シミュレーションを用いて、RL-ROEの性能を評価した。その結果、RL-ROEは従来のカルマンフィルターベースの推定器(KF-ROE)に比べて、特に少数のセンサーを使う場合に大幅な性能向上を示した。また、未知の物理パラメータに対しても高精度な状態推定が可能であることが確認された。
Stats
ナビエ・ストークス方程式の場合、Re = 35では最大速度が約1.28、Re = 65では約1.12、Re = 105では約1.4となった。
バーガーズ方程式の場合、μ = 0.05では最大速度が約2.4、μ = 0.45では約1.8、μ = 0.95では約1.2となった。