Linnk AI herunterladen
•
Forschungsassistent
>
Anmelden
Einblick
-
アクティブファインチューニング
汎用ポリシーのアクティブファインチューニング:情報利得に基づく効率的なデモンストレーション収集によるマルチタスク強化学習
事前学習済み汎用ポリシーのマルチタスク環境への適応を効率化する、情報利得に基づくアクティブなデモンストレーション収集手法を提案する。
1