本研究では、ファッション物体検出とセグメンテーションの既存の最先端モデルの限界に取り組むため、新しいデータセットFashionFailを紹介する。FashionFailは、オンラインショッピング画像を対象とし、非モデル着用の衣服や接写の画像を含む。
データセットの作成では、最新の基盤モデルを活用した新しい注釈ツールを開発し、効率的にデータをキュレーションした。FashionFailの主な目的は、モデルの堅牢性を評価するテストベッドとして機能することである。
分析の結果、Attribute-Mask R-CNNやFashionformerなどの最先端モデルに重大な欠点があることが明らかになった。そこで、単純なデータ拡張手法を提案し、一般的な失敗事例を軽減し、モデルの堅牢性を向上させた。
本研究は、産業応用に向けたファッション物体検出とセグメンテーションの研究を促進し、支援することを目的としている。データセット、注釈ツール、コード、モデルは https://rizavelioglu.github.io/fashionfail/ で公開されている。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Riza Veliogl... a las arxiv.org 04-15-2024
https://arxiv.org/pdf/2404.08582.pdfConsultas más profundas