核心概念
事前学習とエピソード学習の必要性を排除することで、ドメインギャップの問題を軽減し、大幅な時間とリソースの節約を実現する。さらに、クエリ-サポート間の相互作用を学習するQUESTモジュールを導入することで、パフォーマンスを向上させる。
摘要
本論文は、3D点群セグメンテーションのための効率的な非パラメトリックネットワークであるSeg-NNとその改良版Seg-PNを提案している。
まず、Seg-NNは事前学習とエピソード学習を必要としない完全な非パラメトリックなエンコーダを採用する。これにより、ドメインギャップの問題を軽減し、大幅な時間とリソースの節約を実現する。Seg-NNのエンコーダは、位置と色の情報を統合し、低周波成分を抽出することで、ロバストな3Dシーン表現を得る。最後に、プロトタイプマッチングを用いて、クエリ点群をセグメンテーションする。
次に、Seg-PNは、Seg-NNのエンコーダを継承しつつ、クエリ-サポート間の相互作用を学習するQUESTモジュールを導入する。QUESTモジュールは、サポートセットのプロトタイプをクエリセットのドメインに適応させることで、パフォーマンスを向上させる。
実験の結果、Seg-PNは従来手法を大幅に上回る精度を達成し、かつ学習時間を90%以上削減できることを示している。さらに、Seg-NNは事前学習やエピソード学習を必要とせずに、既存の学習ベースの手法と同等の性能を発揮することを確認した。
统计
少量データ3Dシーンセグメンテーションタスクにおいて、Seg-PNは従来手法を+4.19%、+7.71%上回る精度を達成した。
Seg-PNの学習時間は従来手法の90%以上短縮された。
引用
"To reduce the reliance on large-scale datasets, recent works in 3D segmentation resort to few-shot learning."
"Current 3D few-shot segmentation methods first pre-train models on 'seen' classes, and then evaluate their generalization performance on 'unseen' classes. However, the prior pre-training stage not only introduces excessive time overhead but also incurs a significant domain gap on 'unseen' classes."
"Seg-NN discards all two stages of pre-training and episodic training and performs comparably to some existing parametric methods. Such a training-free property simplifies the few-shot training pipeline with minimal resource consumption and mitigates the domain gap caused by different training-test categories."