Conceitos Básicos
OFF-FSPは競争ゲームでNEを近似し、部分的にカバーされたデータセットでも効果的である。
Resumo
この論文では、オフラインマルチエージェント強化学習を競争ゲームに適用するためのOFF-SPとOFF-FSPを提案しています。実験結果は、すべてのOFF-FSPの変種が他のベースラインを大幅に上回っていることを示しています。さらに、部分的にカバーされたデータセットでもNEを近似する能力があることが示されています。
Estatísticas
データセットDEは完全なカバレッジデータセットである。
P20、P10、P5は部分的にカバーされたデータセットであり、異なる品質の混合戦略からサンプリングされている。
Citações
"OFF-FSPはNEを近似し、部分的にカバーされたデータセットでも効果的である。"
"すべてのOFF-FSPの変種が他のベースラインを大幅に上回っていることを示しています。"