核心概念
カウンタと1ビットの公開メモリを使えば、確率的同時ゲームにおけるBüchi目的関数に対して、最大プレイヤーは𝜀-最適な戦略を持つことができる。
摘要
本論文は、2人の対戦プレイヤー(Max and Min)が、無限グラフ上の確率的同時ゲームで、Büchi目的関数を最大化/最小化することを研究している。
主な結果は以下の通り:
-
Maxは、カウンタと1ビットの公開メモリを使った1-ビットマルコフ戦略によって、Büchi目的関数に対して𝜀-最適な戦略を持つことができる。これは有限グラフの場合でも新しい結果である。
-
Maxは、Büchi目的関数とTransience目的関数の組み合わせに対して、1ビットの公開メモリを使った𝜀-最適な戦略を持つことができる。これは、Transience目的関数単独の場合にも、メモレスの𝜀-最適な戦略が存在することを意味する。
-
Transience目的関数単独の場合、Maxはメモレスの𝜀-最適な戦略を持つことができる。ただし、この戦略はランダム化を必要とする。
これらの結果は、確率的同時ゲームにおける目的関数の戦略複雑性を明らかにしている。特に、Büchi目的関数に対するMaxの戦略複雑性は、有限グラフの場合でも新しい知見を提供している。
統計資料
確率的同時ゲームにおいて、Maxは、カウンタと1ビットの公開メモリを使った1-ビットマルコフ戦略によって、Büchi目的関数に対して𝜀-最適な戦略を持つことができる。
Maxは、1ビットの公開メモリを使った𝜀-最適な戦略を持つことができる、Büchi目的関数とTransience目的関数の組み合わせ。
Transience目的関数単独の場合、Maxはメモレスの𝜀-最適な戦略を持つことができるが、ランダム化を必要とする。
引述
"Max has a 1-bit Markov strategy 𝜎such that (1) 𝜎[0] is multiplicatively 𝜀-optimal from every state, and (2) all memory updates 𝜎𝑢𝑝(·) are Dirac (hence the memory is public)"
"Max has a 1-bit strategy 𝜎so that (1) 𝜎[0] is multiplicatively 𝜀-optimal from every state, and (2) all memory updates 𝜎𝑢𝑝(·) are Dirac (hence the memory is public)."
"Max has a memoryless strategy that is multiplicatively 𝜀-optimal from every state."