Download Linnk AI
•
Forskningsassistent
>
Log på
indsigt
-
報酬の誤定義に対処する対話型アルゴリズム
報酬の誤定義と期待値のミスマッチを同時に扱う手法
ユーザーの期待と報酬関数の間のミスアラインメントを理解し、効率的に解決するための対話型アルゴリズムを提案する。
1