Core Concepts
単一のコントローラで複数の形態のロボットを制御できるようにする。
Abstract
本研究では、多様性探索アルゴリズムと知識蒸留の手法を組み合わせることで、単一のコントローラが複数の形態のロボットを制御できるようにする。
まず、Quality Diversity アルゴリズムを用いて、様々な形態のロボットとその最適化されたコントローラを発見する。次に、これらの個別最適化されたコントローラの知識を蒸留することで、単一のコントローラを学習する。
この蒸留されたコントローラは以下のような特性を示す:
個別最適化されたコントローラと同等の性能を発揮できる
学習したコントローラ数が増えるほど性能が向上する
未知の形態のロボットに対しても良好な一般化性能を示す
未知の形態のロボットに対する適応性が高く、迅速な微調整が可能
これらの特性から、本手法は大規模ロボティクスにおける基盤技術として期待できる。また、既存の複雑なコントローラアーキテクチャとも相補的に利用できる。
Stats
単一の最適化されたコントローラと比較して、蒸留されたコントローラの性能は平均して1.5倍高い。
蒸留されたコントローラは、未知の形態のロボットに対して、最も近い形態のロボットのコントローラよりも有意に高い性能を示す (p < 0.001)。
蒸留されたコントローラを初期値として使うと、未知の形態のロボットや新しい課題への適応が従来手法よりも迅速である。
Quotes
"蒸留されたコントローラは、未知の形態のロボットに対して、最も近い形態のロボットのコントローラよりも有意に高い性能を示す。"
"蒸留されたコントローラを初期値として使うと、未知の形態のロボットや新しい課題への適応が従来手法よりも迅速である。"