この研究は、2つの変数の関数のベイジアン最適化において、ユーザーとAIエージェントが交互に座標を選択する協力的セットアップを紹介しています。AIエージェントが先に座標を選択する場合は困難であり、そのためAIエージェントはユーザーの行動を知ることができません。したがって、我々はAIエージェントにユーザーのモデルを与えます。これは、ユーザーの行動や意思決定の確率論的な記述です。このモデルはBayes Adaptive Monte Carlo Planningアルゴリズム内で使用され、ユーザーの振る舞いをシミュレートします。戦略的計画により、AIエージェントはユーザーのバイアスや現在のドメイン知識に合わせた選択肢を行うことが可能となります。実証的には、我々の方法は非戦略プランナーよりも優れた最適化スコアをもたらします。
Cooperative Bayesian Optimization for Imperfect Agents
"我々はBayes Adaptive Monte Carlo Planningアルゴリズム内で使用される確率論的記述(モデル)によって、戦略的計画能力が向上しました。"
"戦略的計画により、チーム全体で探索領域が増加しました。"
"結果から見ても明らかなように、Strategic AIはGreedy AIよりも優れた性能を発揮しました。"