Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
선호 기반 보상 학습
로봇 및 자율 시스템을 가르치기 위한 선호 기반 보상 학습에 대한 일반화된 획득 함수
보상 함수의 매개변수에 대한 정보 획득을 최대화하는 새로운 쿼리 방법의 우수한 성능을 입증하고, 보상 함수를 학습하는 새로운 프레임워크 소개
1