Pobierz Linnk AI
•
Asystent Badawczy
>
Zaloguj się
spostrzeżenie
-
人間からのフィードバックを利用したロボット強化学習
報酬過最適化を軽減するための正則化ベースのソリューション:ロボット強化学習における人間からのフィードバック
人間からのフィードバックに基づいて報酬関数を学習する際に、報酬過最適化の問題を軽減するための正則化手法を提案する。
1