Konsep Inti
提案されたSPINO方法は、少数のアノテーション画像を使用して高品質な疑似ラベルを生成し、既存のパノプティックセグメンテーション手法による競争力のある結果を実現します。
Abstrak
最新の視覚表現学習により、大規模なファウンデーションモデルがトレーニングできるようになりました。本研究では、DINOv2バックボーンと軽量ネットワークヘッドを組み合わせて、少数のアノテーション画像だけで訓練されたSPINO方法が提案されています。この手法は、わずか10枚のアノテーション画像で訓練されたにも関わらず、高品質な疑似ラベルを生成し、任意の既存のパノプティックセグメンテーション手法で使用できます。SPINOは完全に教師付きの基準と競争力のある結果を達成し、人間のアノテーションに依存する完全教師付き学習手法と比較して非常に少ないラベルしか使用していません。
Statistik
SPINOは10枚のアノテーション画像だけで訓練されました。
SPINOは地面実際ラベルの0.29%未満を使用しています。
SPINOは競争力ある結果を達成しました。
Kutipan
"Few-shot panoptic segmentation provides the means to soon become on par with supervised state-of-the-art methods."
"We propose the first method for few-shot panoptic segmentation based on unsupervised foundation models."
"Our pseudo-label generator comprises a much simpler design, estimating object boundaries instead of predicting instance centers and pixel offsets."