核心概念
画像検索のためのトレーニングセットとテストセットの重複は、モデルの性能に大きな影響を与える。また、オブジェクトの検出と特徴抽出を統合したシングルステージのパイプラインが、効率的な画像検索を実現できる。
要約
本研究では、2つの主要な課題に取り組んでいる。
データセットの課題:
最も一般的に使用されているGoogle Landmarks v2 clean (GLDv2-clean)データセットには、評価セットとの重複が存在することを明らかにした。
重複を除去した新しいバージョン、RGLDv2-cleanを作成した。
RGLDv2-cleanを使用して既存の手法を再現したところ、大幅な性能低下が見られた。これは、GLDv2-cleanを使用した従来の研究結果が人為的に高くなっていたことを示唆している。
手法の課題:
オブジェクトの検出と特徴抽出を統合したシングルステージのパイプラインを提案した(CiDeR)。
位置情報の教師信号を必要とせずに、エンドツーエンドで学習できる。
既存の手法よりも高い性能を達成した。
統計
GLDv2-cleanデータセットには、評価セットのランドマークと重複する1,565枚の画像が含まれていた。
RGLDv2-cleanデータセットは、GLDv2-cleanから重複画像を除去したバージョンである。
引用
"Not only is there a dramatic drop in performance, but it is inconsistent across methods, changing the ranking."
"Importantly, as shown in Figure 1(b), this is a streamlined end-to-end approach that only needs single-stage training, single-stage indexing and is free of any location supervision."