本論文は、オープンボキャブラリー物体検出器の細粒度物体特徴認識能力を評価するための新しい評価プロトコルと、それに基づいて作成された一連のベンチマークを提案している。
まず、評価プロトコルでは、各物体に対して詳細な自然言語キャプションを生成し、それに基づいて正解キャプションと誤りキャプションからなる動的な語彙を作成する。これにより、検出器の細かな物体特徴の弁別能力を詳細に評価できる。
次に、提案するベンチマークスイートでは、この評価プロトコルに基づいて、物体の色、素材、模様、透明度などの属性に着目した一連のベンチマークを構築している。これらのベンチマークを用いて、最新のオープンボキャブラリー物体検出器の性能を分析した結果、これらの検出器は物体の細かな特徴を正確に認識することが困難であることが明らかになった。
本研究は、オープンボキャブラリー物体検出の分野における重要な課題を提起し、今後の研究の方向性を示唆している。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Lorenzo Bian... a las arxiv.org 04-09-2024
https://arxiv.org/pdf/2311.17518.pdfConsultas más profundas