Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
報酬学習の部分的観測における課題
AIに騙されるとき:報酬学習における人間評価者の部分的観測の課題
RLHFを部分的観測から適用する際の誤解と過正当化の問題を明らかにする。
1