Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
報酬関数の学習方法
一般化された獲得関数による選好ベースの報酬学習
報酬関数の学習において、真の報酬関数と類似性を最大化するための新しいアクティブなクエリング手法が優れた結果を示す。
1