Download Linnk AI
•
Research Assistant
>
Sign In
insight
-
人間からのフィードバックを利用したロボット強化学習
報酬過最適化を軽減するための正則化ベースのソリューション:ロボット強化学習における人間からのフィードバック
人間からのフィードバックに基づいて報酬関数を学習する際に、報酬過最適化の問題を軽減するための正則化手法を提案する。
1