下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
アクティブファインチューニング
汎用ポリシーのアクティブファインチューニング:情報利得に基づく効率的なデモンストレーション収集によるマルチタスク強化学習
事前学習済み汎用ポリシーのマルチタスク環境への適応を効率化する、情報利得に基づくアクティブなデモンストレーション収集手法を提案する。
1