Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
報酬関数の学習方法
一般化された獲得関数による選好ベースの報酬学習
報酬関数の学習において、真の報酬関数と類似性を最大化するための新しいアクティブなクエリング手法が優れた結果を示す。
1