Belangrijkste concepten
事前学習済み汎用ポリシーのマルチタスク環境への適応を効率化する、情報利得に基づくアクティブなデモンストレーション収集手法を提案する。
Samenvatting
論文要約: 汎用ポリシーのアクティブファインチューニング
論文タイトル: Active Fine-Tuning of Generalist Policies
著者: Marco Bagatella, Jonas H¨ubotter, Georg Martius, Andreas Krause
発表学会: 未記載 (preprint)
本論文は、事前学習済み汎用ポリシーを、新規のマルチタスク環境に効率的に適応させるための、アクティブファインチューニング手法を提案する。具体的には、限られたデモンストレーション予算内で、専門家ポリシーに関する情報利得を最大化するタスクを選択することで、効率的なポリシーのファインチューニングを目指す。