Core Concepts
オンラインでの把握学習のための不確実性に基づく探索戦略を提案し、実世界のビンピッキングシーンでの性能を大幅に向上させる。
Abstract
本研究では、オンラインでの把握学習のための不確実性に基づく探索戦略を提案している。具体的には以下の通りである:
オンラインでの把握学習をRLの問題として定式化し、ConvSACアルゴリズムを用いて把握報酬の予測と把握ポーズの適応を行う。
ベイズ的な不確実性推定と分布回帰に基づいて、ピクセル単位の不確実性マップを計算する。この不確実性マップを用いて、不確実性の高い領域を積極的に探索することで、把握成功率を長期的に向上させる。
複数のMV-ConvSACエージェントとQR-ConvSACエージェントからなるアンサンブルを提案し、エピステミック不確実性とアレアトリック不確実性を効果的に活用する探索戦略を検討する。
実世界のビンピッキングシーンでの実験を通じて、提案手法の有効性を示す。特に、不透明、不規則、曲面といった特徴を持つ難しいオブジェクトに対して、大幅な把握成功率の向上を実現している。
Stats
把握成功率が90%を超えるなど、提案手法は従来手法に比べて大幅な性能向上を実現している。
不確実性の種類によって、把握成功率に大きな差が生じることが分かった。エピステミック不確実性を活用した探索戦略が最も効果的であった。
Quotes
"オンラインでの把握学習のための不確実性に基づく探索戦略を提案し、実世界のビンピッキングシーンでの性能を大幅に向上させる。"
"エピステミック不確実性を活用した探索戦略が最も効果的であった。"