Grunnleggende konsepter
本文提出了一种新的端到端的变换器检测器DQ-DETR,通过分类计数模块、计数引导的特征增强和动态查询选择来解决之前DETR类方法在检测小物体上的局限性。DQ-DETR动态调整用于检测的查询数量,并改善查询的位置信息,使解码器更容易定位微小物体。
Sammendrag
本文提出了一种新的端到端的变换器检测器DQ-DETR,针对之前DETR类方法在检测小物体上的局限性进行了改进。
首先,文章指出之前的DETR类方法使用固定数量的查询,这对于只包含小物体的航空数据集不太合适,因为不同图像中物体的数量差异很大。
为此,DQ-DETR包含三个主要组件:
分类计数模块:预测图像中物体的数量级,并据此动态调整用于检测的查询数量。
计数引导的特征增强:将密度图与编码器的视觉特征相结合,增强小物体的空间信息。
动态查询选择:根据预测的物体数量动态调整查询的数量,并利用增强的特征改善查询的位置信息。
实验结果表明,DQ-DETR在AI-TOD-V2数据集上取得了最佳的检测性能,超越了之前的CNN和DETR类方法。特别是在只有少量物体或大量物体的图像中,DQ-DETR都能取得较好的检测效果。
Statistikk
图像中物体数量小于等于10个时,DQ-DETR的AP为26.1,比基准提高3.6。
图像中物体数量在10到100个之间时,DQ-DETR的AP为28.4,比基准提高4.0。
图像中物体数量在100到500个之间时,DQ-DETR的AP为33.7,比基准提高2.1。
图像中物体数量大于500个时,DQ-DETR的AP为14.7,比基准提高1.2。