核心概念
RGB-Dポイントクラウドから直接グローバルな記述子を抽出するための新しいネットワークアーキテクチャを提案し、色と幾何学的な特徴を統合することで、屋内RGB-D場所認識タスクの性能を大幅に向上させる。
要約
本論文では、屋内RGB-D場所認識タスクのための新しいエンドツーエンドアルゴリズム「PoCo」を提案する。PoCo は、ノイズの多いポイントクラウドから直接グローバルな記述子を抽出するための新しいネットワークアーキテクチャを一般化する。さらに、色と幾何学的な特徴を統合することで、グローバルな記述子の表現を強化している。
PoCo は、ScanNet-PRおよびARKitの2つの大規模なデータセットで評価された。ScanNet-PRでは、最高の既発表結果から5.7%の相対的な改善を達成し、Recall@1が64.63%に達した。ARKitでは、最高の既発表結果から13.3%の改善を達成し、Recall@1が45.12%に達した。さらに、PoCo は推論時間においても効率的であり、CGiSネットよりも1.75倍高速である。
PoCo の主な貢献は以下の通りである:
- 2Dイメージドメインで動作するCoCs概念を一般化し、ポイントクラウドで動作するように拡張した。ローカルなポイント特徴は、新しい集約・分散アプローチを通じて、より高レベルのセンター点と相互作用することで学習される。
- 色と幾何学的な情報を統合して処理するアーキテクチャを開発し、屋内RGB-D場所認識タスクの性能を向上させた。特に、ポイント特徴に幾何学的情報を明示的にエンコーディングすることで、グローバルな記述子の表現を強化した。
- 複数のデータセットで、SOTA手法を大幅に上回る性能を達成した。
統計
ScanNet-PRデータセットでは、最高の既発表結果から5.7%の相対的な改善を達成し、Recall@1が64.63%に達した。
ARKitデータセットでは、最高の既発表結果から13.3%の改善を達成し、Recall@1が45.12%に達した。
PoCo は推論時間においても効率的であり、CGiSネットよりも1.75倍高速である。