Скачать Linnk AI
•
Научный ассистент
>
Войти
аналитика
-
사전 학습된 네트워크 증류를 통한 내재적 동기 향상
사전 학습된 네트워크 증류를 통한 강화 학습에서의 내재적 동기 향상
사전 학습된 표현 모델을 활용하여 목표 네트워크와 예측기 네트워크의 표현을 개선함으로써 의미 있고 안정적인 내재적 보상을 생성하고 모델의 표현 학습을 향상시킨다.
1