Core Concepts
合成データを用いることで、建築外壁材質分類のための手動アノテーションデータの取得を効率化できる。
Abstract
本研究では、建築外壁材質分類のためのデータ取得の課題に取り組んでいる。従来の手動アノテーションデータには偏りがあり、取得が困難な問題がある。そこで、OpenAI's DALL-Eを用いて合成データを生成し、Swin Transformerモデルの性能を評価した。
実験では、以下の4つのアプローチを比較した:
ベースライン: 手動アノテーションデータのみ
拡張: 手動データに合成データを追加
混合: 合成データのみで学習
合成: 合成データのみで学習・評価
結果、手動データに合成データを27%追加した場合に性能が向上した。一方、合成データ比率が80%の場合は性能が低下した。完全に合成データで学習・評価した場合でも、一定の性能を示した。
これらの結果から、合成データを適切に活用することで、建築外壁材質分類のための手動アノテーションデータ取得を効率化できることが示された。ただし、合成データの品質と量のバランスが重要であり、実データでの評価も必要である。
Stats
手動アノテーションデータの偏りが課題となっている
合成データを27%追加した場合、性能が向上した
合成データ比率が80%の場合、性能が低下した
完全に合成データで学習・評価した場合でも、一定の性能を示した
Quotes
"手動アノテーションデータの取得は時間がかかり、クラスの偏りが生じる問題がある"
"合成データを適切に活用することで、手動アノテーションデータ取得の効率化が期待できる"
"合成データの品質と量のバランスが重要であり、実データでの評価も必要である"