Core Concepts
3D ガウシアン表現は、複雑な局所的な幾何学的特徴を明示的に表現し、3D一貫性を備えているため、強化学習タスクにおいて優れた性能を発揮する。
Abstract
本研究は、強化学習のための新しい環境表現手法として、一般化可能な3D ガウシアン表現(GSRL)を提案している。従来の表現手法には以下のような課題があった:
2Dイメージや点群、ボクセルなどでは、複雑な局所的な幾何学的特徴を十分に表現できない
ニューラルレディアンスフィールド(NeRF)などの暗黙的な表現は、汎化性が低く、前景マスクが必要
従来の3D ガウシアン表現は、1シーンごとの最適化が必要で、強化学習に適用できない
そこで本手法では、深層学習を用いて、入力画像から一般化可能な3D ガウシアン表現を直接予測する手法を提案した。この表現は、3D一貫性と詳細な局所幾何学を捉えることができる。
RoboMimicベンチマークを用いた実験では、提案手法が他の表現手法に比べて優れた性能を示した。特に最も難しいタスクでは、ベースラインに比べて10%、44%、15%の性能向上を達成した。これは、提案する3D ガウシアン表現が強化学習に有効であることを示している。
Stats
ベースラインに比べて、提案手法は最も難しいタスクで以下の通り性能が向上した:
BCQアルゴリズムで10%向上
IQLアルゴリズムで44%向上
IRISアルゴリズムで15%向上