Core Concepts
割引支払ゲームの最適解を対称的に求めるための新しいアプローチを提案する。従来のアプローチとは異なり、プレイヤー間の非対称性を排除し、すべての辺を考慮した制約システムを構築し、目的関数を更新することで、最適解に収束する。
Abstract
本論文は、割引支払ゲームを解決するための新しい対称的なアプローチを提案している。
まず、ゲームの辺に基づいて不等式システムを定義し、プレイヤーの戦略を表す辺の誤差を最小化する目的関数を設定する。この目的関数を最小化するための最適解を求めるが、最適解が見つからない場合は、戦略を更新して、より良い目的関数を見つける。
この手法は従来のアプローチとは異なり、プレイヤー間の非対称性を排除し、すべての辺を考慮した制約システムを使用する。また、目的関数の更新と戦略の更新を対称的に行うことで、最適解に収束する。
具体的には以下の手順で進める:
ゲームの辺から不等式システムHを定義する。
初期の戦略σを設定する。
戦略σに基づいて目的関数fσを定義し、Hの下での最適解valを求める。
valが最適解を定義する戦略を表す場合は終了。そうでない場合は、より良い戦略σ'を見つける。
新しい戦略σ'に基づいて目的関数を更新し、ステップ3に戻る。
この手法は、従来のアプローチとは異なり、プレイヤー間の非対称性を排除し、すべての辺を考慮した制約システムを使用することで、最適解を対称的に求めることができる。
Stats
val(a) = 1 / (1 - λ)
val(b) = λ / (1 - λ)