核心概念
GANとテクスチャ合成を組み合わせて、道路損傷データの質を向上させる革新的な手法を提案します。
要約
交通安全と道路保守において、正確な道路損傷の検出は重要です。本研究では、Generative Adversarial Networks(GAN)を使用して異なる形状のダメージを生成し、適切な位置に手動で統合することが試みられました。しかし、この問題はまだ十分に探求されており、2つの課題に直面しています。最初に、生成されたダメージが背景とよく一致するよう選択する必要があります。これらは水平多様性を豊かにするだけであり、ダメージの重症度も考慮すべきです。第二に、データ拡張プロセスは依然として人間の干渉を大幅に必要とします。提案された手法では、WGAN-GPを使用してリアルなダメージROIを生成し、テクスチャ合成モデルを使用して道路からテクスチャを効果的に抽出します。これら2つの要素は異なる重症度レベルで混合され、原画像にシームレスに埋め込まれます。また、自動化されたサンプル選択中に構造類似性を活用して労働コストを節約します。
統計
提案手法はmAPが4.1%向上し、F1スコアが4.5%向上したことが示されました。
RDD2019データセットは10,186枚の注釈付き画像から成ります。
'D40'カテゴリ(ポットホール)では1,164枚の画像が含まれています。
引用
"提案された方法は水平多様性だけでなく垂直多様性も拡張しました"
"我々はテクスチャ合成モデルを利用して道路表面からテクスチャ特徴量を抽出しました"
"我々は各オリジナルトレーニングデータごとに3つの異なる拡張バージョンを取得しました"