تنزيل Linnk AI
•
مساعد بحث
>
سجل دخولك
رؤى
-
強化学習 多エージェント
自己学習を考慮した最適応答の形成
部分的競争環境では、従来の手法では相互協調的な政策を育成することが困難であるが、本手法では、相手の最適応答を近似する「探偵」を用いることで、相互協調的な政策を学習できる。
1