核心概念
本稿では、人間とゼロショットで協調できるエージェントを訓練するために、人間の行動を模倣した生成モデルを用いる新しい手法「GAMMA」を提案する。シミュレーションデータと人間の協調データの両方を学習に活用することで、従来の手法を超える協力行動を実現できることを示す。
要約
人間との協調のための生成エージェントモデリング:論文要約
Yancheng Liang, Daphne Chen, Abhishek Gupta, Simon S. Du*, Natasha Jaques*. "Learning to Cooperate with Humans using Generative Agents". 38th Conference on Neural Information Processing Systems (NeurIPS 2024). 2024.
人間と協調できるAIエージェントを開発するにあたり、未知の人間パートナーにも適応できるゼロショット協調能力の実現を目指す。具体的には、人間の多様な戦略やスタイルを模倣した生成モデルを用いて、より人間らしい協調行動を学習させることを目的とする。