Kernekoncepter
疎な半教師あり物体検出(Sparse Semi-DETR)は、物体クエリの品質を向上させ、小さな物体や部分的に隠れた物体の検出精度を大幅に改善する。また、信頼性の高い擬似ラベルのフィルタリングモジュールを導入し、検出精度と一貫性を高めている。
Resumé
本論文は、DETR(Detection Transformer)ベースの半教師あり物体検出(SSOD)フレームワークの限界に取り組んでいる。特に、物体クエリの品質に起因する課題に焦点を当てている。
DETR-ベースのSSODでは、one-to-one割り当て戦略では擬似ラベルが不正確になり、one-to-many割り当て戦略では重複する予測が発生する。これらの問題は、訓練の効率を損ね、特に小さな物体や部分的に隠れた物体の検出性能を低下させる。
本手法では以下の2つの新しい手法を提案している:
- クエリ改善モジュール:
- 低レベルの特徴と高レベルの特徴を融合し、注意機構を用いて物体クエリの品質を大幅に向上させる。
- これにより、小さな物体や部分的に隠れた物体の検出精度が大幅に向上する。
- また、クエリ数を削減することで効率的な処理が可能となる。
- 信頼性の高い擬似ラベルフィルタリングモジュール:
- 高品質の擬似ラベルを選択的にフィルタリングすることで、検出精度と一貫性を向上させる。
- one-to-manyの割り当て戦略で発生する重複予測を効果的に削減する。
提案手法であるSparse Semi-DETRは、MS-COCOとPascal VOCのベンチマークで現行の最先端手法を大幅に上回る性能を示している。特に、小さな物体や部分的に隠れた物体の検出において顕著な改善が見られる。
Statistik
10%のラベル付きデータを使用した場合、Sparse Semi-DETRは44.3 mAPを達成し、従来手法を9.3 mAP上回っている。
完全なCOCOデータセットを使用した場合、Sparse Semi-DETRは51.3 mAPを達成し、従来手法を5.2 mAP上回っている。
Sparse Semi-DETRは、小さな物体の検出においても従来手法を大幅に上回る性能を示している。
Citater
"DETR-ベースのSSODでは、one-to-one割り当て戦略では擬似ラベルが不正確になり、one-to-many割り当て戦略では重複する予測が発生する。これらの問題は、訓練の効率を損ね、特に小さな物体や部分的に隠れた物体の検出性能を低下させる。"
"本手法では以下の2つの新しい手法を提案している:クエリ改善モジュールと信頼性の高い擬似ラベルフィルタリングモジュール。"
"提案手法であるSparse Semi-DETRは、MS-COCOとPascal VOCのベンチマークで現行の最先端手法を大幅に上回る性能を示している。特に、小さな物体や部分的に隠れた物体の検出において顕著な改善が見られる。"