Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
アクティブファインチューニング
汎用ポリシーのアクティブファインチューニング:情報利得に基づく効率的なデモンストレーション収集によるマルチタスク強化学習
事前学習済み汎用ポリシーのマルチタスク環境への適応を効率化する、情報利得に基づくアクティブなデモンストレーション収集手法を提案する。
1