Core Concepts
合成トレーニングデータは、産業環境での物体検出性能に影響を与えることが示された。
Abstract
産業製造では、深層学習モデルを導入することで生産性向上や新しいアプリケーションが可能になるが、十分なデータ収集とラベリングが困難。画像合成方法を使用して自動的に生成されたトレーニングデータを評価。RetinaNetとFaster R-CNNの結果は、最適化されたスケーリング条件下で類似したオブジェクトを区別することが重要であることを示唆。
Stats
合計300枚の実際の端子ストリップ画像を手動で注釈付け。
平均精度差:RetinaNet 2.69%、Faster R-CNN 0.98%。
合計30,000枚の合成端子ストリップ画像。
Quotes
"合成トレーニングデータは、現実世界への一般化性能に影響を与える可能性がある"
"最適化されたスケーリング条件下では、DLモデルのパフォーマンスが大幅に向上する"