Core Concepts
IGE-LLMsは、内在報酬としてLLMsを活用し、ロボット操作タスクでの探索を促進する。
Abstract
現在の強化学習アルゴリズムは、長期ロボット操作タスクで苦戦しており、IGE-LLMsが提案された。このフレームワークは、LLMsを補助的な内在報酬として活用し、探索学習プロセスを誘導することで複雑な長期・希少報酬のロボット操作タスクに対処する。IGE-LLMsは関連する内在学習方法や直接的なLLMの使用と比較して高いパフォーマンスを示し、既存の学習方法と組み合わせて利用可能であり、異なる内在スケーリングパラメータに対しても比較的不感受性があることが示された。
Stats
現実的な学習ベースのロボティックシミュレーションではUnity3Dシミュレーションエンジンが使用されていた。
GPT-4 LLMが使用されており、微調整は行われていなかった。
ロマン環境では物理周波数が1000Hzに設定されていた。
Quotes
"IGE-LLMsは関連する内在方法や直接的なLLMの使用よりも高いパフォーマンスを示す"
"IGE-LLMsは異なる内在スケーリングパラメータに対しても比較的不感受性がある"