本論文は、確率的展開形ゲームと決定問題の統一理論の構築を目指すシリーズの第一弾である。従来の展開形理論では、連続時間確率過程を外生的な「自然」エージェントの意思決定としてモデル化することが困難であった。本論文では、この問題に対処するため、確率的決定フォレストという新しい枠組みを提案する。
確率的決定フォレストは、各決定木が1つの外生的なシナリオに対応する決定木の集合であり、木々の間の類似性構造によって移動が識別される。従来の決定木ベースの展開形理論とは異なり、確率的決定フォレストでは、外生的な情報は「自然」エージェントの行動ではなく、実現したシナリオによって決定される。
本論文は、まず決定フォレストの定義と解釈を述べ、それが決定木の集合であることを示す。次に、外生的なシナリオ空間と確率測度について議論し、確率的決定フォレストの定義を与える。さらに、いくつかの単純な例を提示し、時間索引付き行動パスに基づく確率的決定フォレストのクラスを構築する。最後に、確率的決定フォレストにおける適応的な選択の概念を導入する。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询