Centrala begrepp
ロボット操縦者が未知の物体を任意の姿勢で操作できるよう、物体の部分的に構築されたNeRFモデルの不確実性を考慮しながら、視覚的な観察と物体の再配置を通して効率的に物体の完全な3Dモデルを構築する。
Sammanfattning
本研究では、ロボット操縦者が未知の物体を任意の姿勢で操作できるよう、物体の部分的に構築されたNeRFモデルの不確実性を考慮しながら、視覚的な観察と物体の再配置を通して効率的に物体の完全な3Dモデルを構築する手法を提案する。
具体的には以下の通り:
ビジョンファウンデーションモデルを活用して物体を分離し、物体の不確実性をシーン全体の不確実性から切り離す。
部分的に構築されたモデルの不確実性、動作コスト、キネマティック制約を考慮しながら、次の最も有益な行動(視覚的観察または物体の再配置)を決定する最適化手法を提案する。
部分的に構築されたモデルの不確実性を考慮しながら、物体をつかみ直して姿勢を変更し、変更後の姿勢を再推定することで、段階的に獲得したモデルを統合する手法を提案する。
実験では、シミュレーション環境でFranka Emika ロボットアームを使用し、ベンチマークオブジェクトを対象に評価を行った。提案手法は、視覚的再構成品質(PSNR)で14%、幾何学的/深度再構成(F-score)で20%、未知の姿勢/安定した配置からの物体操作タスクの成功率で71%の改善を示した。
Statistik
提案手法は、視覚的再構成品質(PSNR)で14%の改善を示した。
提案手法は、幾何学的/深度再構成(F-score)で20%の改善を示した。
提案手法は、未知の姿勢/安定した配置からの物体操作タスクの成功率で71%の改善を示した。