Core Concepts
データ拡張は深層学習モデルの一般化性能を向上させるが、実世界の視覚特徴との差異が残存する。
Abstract
本研究は、コンピュータービジョンにおけるデータ拡張の一般化性能を検証した。特に、照明環境を制御した分類タスクを通じて、拡張データと実世界データの差異を明らかにした。
実験1では、照明分布の違いがモデルの一般化性能に大きな影響を与えることを示した。均一な照明分布のデータセットと単一の照明分布のデータセットを用いて比較したところ、後者のモデル性能が大幅に低下した。
実験2では、照明ベクトルマッピングによるデータ拡張手法を提案し、単一照明分布のデータセットの性能を大幅に改善できることを示した。
実験3では、Bayesian最適化によるカラー拡張手法を検討し、さらなる性能向上を実現した。しかし、拡張データを用いたモデルでも、実世界の照明分布を含むデータセットに及ばない一般化ギャップが残存することが明らかになった。
これらの結果は、データ拡張手法にはモデルの一般化性能に限界があり、実世界の視覚特徴の多様性を捉えることの重要性を示唆している。
Stats
単一照明分布のデータセットでは、モデルの精度が約0.67低下した。
照明ベクトルマッピングによる拡張データセットでは、モデルの精度が約0.57向上した。
Bayesian最適化によるカラー拡張でも、実世界の照明分布を含むデータセットには及ばない一般化ギャップが残存した。
Quotes
"データ拡張は深層学習モデルの一般化性能を向上させるが、実世界の視覚特徴との差異が残存する。"
"実験結果は、データ拡張手法にはモデルの一般化性能に限界があり、実世界の視覚特徴の多様性を捉えることの重要性を示唆している。"