本研究は、多エージェント強化学習を用いて、囚人のジレンマゲームにおける協力と相互作用の共進化ダイナミクスを探究しています。従来の研究では、外部の報酬や社会規範に依存していましたが、本研究では、エージェントが長期的な経験から学習することで、協力的な隣人を選択し、非協力的な隣人を避けるという選択的な相互作用行動を自発的に獲得することを示しています。
この選択的な相互作用行動は、協力的なエージェントが集まる戦略のクラスターを形成し、ネットワークの相互性を高めることで、グループ全体の協力レベルを向上させます。さらに、エージェントの記憶長が長いほど、この選択的な相互作用能力が高まり、協力の進化がより効果的に促進されることが明らかになりました。
本研究の成果は、社会的ジレンマの状況下で自発的な協力行動を生み出す仕組みを理解する上で重要な知見を提供しています。また、人工知能システムにおける協力的な行動の創発に向けた新たな示唆も得られると期待されます。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies