本論文では、2人ゼロ和並行確率ゲームにおいて、ステートフル割引和目的関数と優先度目的関数の値を近似的に計算する問題を扱っている。
ステートフル割引和目的関数は、各状態に異なる割引係数が割り当てられた割引和目的関数の一般化である。一方、優先度目的関数は、ω-正則目的関数を表す標準的な形式である。
これらの目的関数の値を近似的に計算する問題は、以前は指数空間の計算量であったが、本論文では、非決定性多項式時間クラスTFNP[NP]に属することを示した。さらに、アクション数に関する計算量の依存度を指数関数的から対数関数的に改善したアルゴリズムを提案した。特に、状態数が定数の場合、多項式時間で解くことができる。
この結果は、ステートフル割引和目的関数と優先度目的関数を持つ並行確率ゲームの値を効率的に近似計算できることを示している。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問