ZSC-Eval, a comprehensive toolkit and benchmark, generates diverse evaluation partners, selects representative partners, and measures generalization performance to accurately evaluate multi-agent zero-shot coordination capabilities.
ZSC-Eval は、未知のパートナーとの協調を評価するための包括的なツールキットとベンチマークを提供する。行動選好報酬を用いた評価パートナー候補の生成、Best Response Diversityに基づく評価パートナーの選択、Best Response Proximityによる協調能力の測定を行う。