Download Linnk AI
•
Autonom forskningsassistent
>
Log på
indsigt
-
이중 액터-크리틱
강화학습에서 시간차 오차 기반 정규화를 활용한 이중 액터-크리틱 알고리즘
강화학습에서 더 나은 가치 추정을 위해 이중 액터-크리틱 프레임워크에 시간차 오차 기반 정규화를 도입한 새로운 알고리즘을 제안한다.
1