Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
部分的に競争的な環境における相互協力を実現するための強化学習アルゴリズム
相手のQ学習への意識を持つ学習: LOQA
LOQAは、相手のQ値関数に基づいて相手の行動を予測し、自身の行動を調整することで、部分的に競争的な環境において個人の効用を最大化しつつ協力を促進する強化学習アルゴリズムである。
1