מושגי ליבה
カテゴリーベースとオブジェクトアイデンティティベースの埋め込みを同時に学習することで、認識と検索の性能を大幅に向上させることが可能である。
תקציר
ポーズ不変物体認識および検索において、カテゴリーベースとオブジェクトアイデンティティベースの埋め込みを同時に学習することが重要である。提案されたアプローチは、双方向エンコーダーアーキテクチャを使用し、特別に設計された損失関数を用いて2つの異なる埋め込み空間で同時にインターおよびイントラクラス距離を最適化する。この方法は、3つの多視点データセットで強力な性能を示しており、単一視点物体認識では以前の最高記録を20.0%(ModelNet40)、2.0%(ObjectPI)、46.5%(FG3D)上回り、単一視点物体検索では33.7%(ModelNet40)、18.8%(ObjectPI)、56.9%(FG3D)上回っている。
סטטיסטיקה
提案手法はModelNet40で20.0%、ObjectPIで2.0%、FG3Dで46.5%の改善を示しています。
単一視点物体認識では以前の最高記録を20.0%(ModelNet40)、2.0%(ObjectPI)、46.5%(FG3D)上回っています。
単一視点物体検索では33.7%(ModelNet40)、18.8%(ObjectPI)、56.9%(FG3D)上回っています。
ציטוטים
"Rather than learning representations that capture both category-specific and object-specific discriminative features within the same embedding space, we simultaneously learn them in two distinct embedding spaces."
"Learning dual embeddings leads to better overall performance, especially for object-based tasks."
"Our method outperforms state-of-the-art methods on several pose-invariant classification and retrieval tasks on three publicly available multi-view object datasets."