核心概念
MULTIGAIN 2.0は、MDPに対して長期平均報酬の最大化を行いつつ、LTL仕様と定常状態制約を満たすコントローラを合成するツールである。
摘要
MULTIGAIN 2.0は、PRISMモデルチェッカーに基づいて構築された拡張版のツールである。主な機能は以下の通り:
- 長期平均報酬(LRA)、線形時間論理(LTL)、定常状態(SS)の3種類の仕様を組み合わせたクエリに対応
- LRAの最大化、LTLの満足度、SSの制約を同時に満たすコントローラの合成
- 2次元および3次元のPareto曲線の可視化による多目的最適化の支援
- 決定性メモリ有限ポリシーの合成や、単一の再帰的クラスに収束するユニチェインポリシーの合成にも対応
ツールの入力は、MDPモデルとクエリ仕様からなる。クエリ仕様には、LRA、LTL、SSの各種プロパティを組み合わせて記述できる。出力は、最適なコントローラ、Pareto曲線、統計データなどである。
実験評価では、グリッドワールドモデルを用いて、LRA、LTL、SSの組み合わせクエリに対する性能を確認した。また、定常状態制約の数や、LP ソルバの選択が及ぼす影響についても分析した。全体として、MULTIGAIN 2.0は、MDPに対する複雑な仕様の下でのコントローラ合成を効率的に行えることが示された。
統計資料
4x4グリッドでの平均実行時間は0.121秒
16x16グリッドでの平均実行時間は0.231秒
32x32グリッドでの平均実行時間は0.466秒
64x64グリッドでの平均実行時間は1.296秒
128x128グリッドでの平均実行時間は26.104秒