Last ned Linnk AI
•
Autonom forskningsassistent
>
Logg Inn
innsikt
-
LLMs를 활용한 강화학습에서의 신용 할당
LLMs의 제로샷 능력을 활용한 강화학습에서의 행동 평가
LLMs의 사전 지식을 활용하여 강화학습 에이전트의 행동을 평가하고 보상 형성을 자동화할 수 있다.
1