Core Concepts
事前学習済みの言語条件付きモデルの不確実性を適切に考慮することで、ロボット操作タスクの成功率を大幅に向上させることができる。
Abstract
本研究では、事前学習済みの言語条件付きモデルを活用したロボット操作タスクにおいて、モデルの出力の不確実性を適切に考慮することで、タスク成功率を大幅に向上させる手法を提案している。
具体的には以下の2つのステップから成る:
温度スケーリングを用いてモデルの出力を校正し、各行動の正解確率を適切に推定する。
行動選択の際に、各候補行動の周辺の行動の確率を合計することで、不確実性を考慮した行動選択を行う。
この手法を3つの事前学習済みモデル(PerAct、RVT、CLIPort)に適用した結果、いずれのモデルでも有意な成功率の向上が確認された。特に、PerActとRVTでは校正が重要であり、CLIPortでは事前学習済みモデルが既に良好に校正されているため、校正は必要ないことが分かった。
さらに、ディストラクタが存在する環境でも、提案手法は頑健に機能し、事前学習済みモデルに比べて大幅な性能向上を示した。これは、不確実性を考慮した行動選択が、一般化性能の向上にも寄与することを示唆している。
Stats
PerActモデルでは、"put groceries in cupboard"タスクの最大エントロピーが最も高く、提案手法の効果が最も大きかった。