Unduh Linnk AI
•
Asisten Riset
>
Masuk
wawasan
-
アクティブファインチューニング
汎用ポリシーのアクティブファインチューニング:情報利得に基づく効率的なデモンストレーション収集によるマルチタスク強化学習
事前学習済み汎用ポリシーのマルチタスク環境への適応を効率化する、情報利得に基づくアクティブなデモンストレーション収集手法を提案する。
1