ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
アクティブファインチューニング
汎用ポリシーのアクティブファインチューニング:情報利得に基づく効率的なデモンストレーション収集によるマルチタスク強化学習
事前学習済み汎用ポリシーのマルチタスク環境への適応を効率化する、情報利得に基づくアクティブなデモンストレーション収集手法を提案する。
1