Download Linnk AI
•
AI-onderzoeksassistent
>
Inloggen
inzicht
-
統一的な強化学習アルゴリズム
報酬なし強化学習、モデル推定、嗜好ベース学習など、様々な目標に対する統一的なアルゴリズム
様々な強化学習の目標(報酬なし学習、モデル推定、嗜好ベース学習など)に対して、一つの一般的な複雑性指標と対応するアルゴリズムを提案する。これらの指標は各目標の下限にもなる。
1