Основные понятия
提案されたCOLEフレームワークは、協力的な不適合性を効果的に克服し、ゼロショット調整能力を向上させることができます。
Аннотация
提案されたCOLEフレームワークは、グラフ理論を活用して協力的なゲームを直感的に再構築し、協力的な不適合性を効率的に評価および特定することができます。さらに、GFGのための経験ゲームスケープを開発して目標を理解し、最近の集団内で好まれる最良の応答を反復的に近似するCOLEフレームワークが提示されています。理論的には、COLEフレームワークはすべての他者から好まれる最適戦略に収束することが証明されています。さらに、優先中心度関数として入次数中心度を選択した場合、COLEフレームワークの収束率はQ-サブリニアルとなります。
Статистика
50回均等にサンプリングされたチェックポイントごとの報酬行列
グラフィック・シャプリ値計算結果から得られる協力不適合分布
COLESVアルゴリズム実装時のパートナーサンプリング比率0:4, 1:3, 2:2, 3:1
Цитаты
"Zero-shot coordination in cooperative artificial intelligence (AI) remains a significant challenge."
"Cooperative Open-ended LEarning (COLE) framework constructs open-ended objectives in cooperative games with two players from the perspective of graph theory."
"The experimental results in the Overcooked game environment demonstrate that our method outperforms current state-of-the-art methods when coordinating with different-level partners."