Core Concepts
IntervalMDP.jlは、間隔マルコフ決定過程に対する価値反復アルゴリズムの並列化と GPU 処理を導入し、検証と戦略合成の効率化を提供する。
Abstract
本論文では、IntervalMDP.jlというJuliaパッケージを紹介する。IntervalMDP.jlは、間隔マルコフ決定過程(IMDP)に対する価値反復アルゴリズムの並列化と GPU 処理を実現し、検証と戦略合成の効率化を図っている。
主な特徴は以下の通り:
最適化戦略と最悪戦略の組み合わせに対応
疎行列と密行列の両方をサポート
数値精度をカスタマイズ可能
CPU マルチスレッドと CUDA 対応の GPU 実装を提供
様々なフォーマット(PRISM、bmdp-tool、IntervalMDP.jl独自)のデータ入出力に対応
IMDPモデルの構築方法、検証と合成の実行方法、GPU 実装の詳細アルゴリズムについて説明する。また、35種類のベンチマークモデルを用いた評価実験の結果を示す。実験では、IntervalMDP.jlがCPU実装で既存ツールの2-4倍、GPU実装で50-200倍高速であることを確認した。さらに、メモリ消費も既存ツルより少ないことが分かった。
Stats
最大ペシミスティック確率を計算する問題の最大状態数は42634、最大遷移数は48106480である。
最大ペシミスティック確率を計算するのに、bmdp-toolは6865秒、PRISMは1235秒、IntervalMDP.jlのCPU実装は372秒、GPU実装は30秒かかった。
Quotes
"IntervalMDP.jlは、並列アルゴリズムを活用し、CUDA対応ハードウェアの利点を生かすことで、既存ツールに比べて50-200倍高速な価値反復計算を実現する。"
"IntervalMDP.jlは、疎行列フォーマットとJulaの型システムを活用することで、既存ツールよりもメモリ消費が少ない。"