تنزيل Linnk AI
•
مساعد بحث
>
سجل دخولك
رؤى
-
부분적으로 경쟁적인 환경에서의 상호 협력 강화학습
LOQA: 상대방의 Q-러닝 인식을 활용한 학습
LOQA는 상대방의 행동-가치 함수를 모델링하여 상호 협력을 유도하는 분산 강화학습 알고리즘이다.
1