Core Concepts
SAM-6Dは、新規オブジェクトの6D姿勢推定を実現するための革新的なフレームワークです。
Abstract
SAM-6Dは、Segment Anything Model(SAM)を利用して、新規オブジェクトのインスタンスセグメンテーションと姿勢推定を行います。ISMはすべての可能性のあるオブジェクト提案を生成し、それぞれに意味論、外観、および幾何学に関するオブジェクト一致スコアを割り当てます。PEMは部分対部分点マッチング問題を解決し、粗いポイントマッチングと細かいポイントマッチングの2段階でオブジェクト姿勢を予測します。SAM-6Dは既存の手法を大幅に上回る結果を示しています。
Stats
SAM-6Dは7つのBOPベンチマークデータセットで既存手法よりも優れた結果を達成しています。
ISMとPEMがそれぞれ異なる機能や役割を果たしています。
SAM-6DはInstance Segmentation Model(ISM)とPose Estimation Model(PEM)から構成されています。
Quotes
"Without bells and whistles, SAM-6D outperforms the existing methods on the seven core datasets of the BOP Benchmark."
"By treating pose estimation as a partial-to-partial point matching problem, PEM performs a two-stage point matching process featuring a novel design of background tokens."