核心概念
混合サンプルデータ拡張(MSDA)は、一部のクラスの性能を向上させる一方で、他のクラスの性能を低下させる、クラス依存性を持つことが明らかになった。この問題に取り組むため、DropMixと呼ばれる新しい手法を提案し、クラス依存性を軽減しつつ全体的な精度も向上させることができた。
要約
本研究では、画像認識タスクにおける混合サンプルデータ拡張(MSDA)の効果がクラスに依存することを明らかにした。具体的には以下の通り。
- Mixup、CutMix、PuzzleMixといった代表的なMSDA手法を、CIFAR-100およびImageNetデータセットに適用した実験を行った。
- MSDA手法の適用により、全体的な精度は向上するものの、一部のクラスの性能が大幅に低下することが分かった。
- クラス依存性の程度を定量的に評価するための指標を提案した。具体的には、性能が低下したクラスの数(NDC)と、それらクラスの平均性能低下率(∆RDC)を指標とした。
- DropMixと呼ばれる新しい手法を提案し、実験の結果、クラス依存性を軽減しつつ全体的な精度も向上させることができた。
- クラス依存性の原因について分析を行い、MSDA手法によるラベル情報の損失の程度がクラスによって異なることが一因であることを示唆した。
統計
Mixupを適用したPreActResNet50モデルでは、平均精度が1.39%向上したが、24クラスの性能が低下した。
CutMixを適用したPreActResNet50モデルでは、平均精度が3.02%向上したが、13クラスの性能が低下した。
PuzzleMixを適用したPreActResNet50モデルでは、平均精度が4.03%向上したが、6クラスの性能が低下した。
引用
"混合サンプルデータ拡張(MSDA)は、一部のクラスの性能を向上させる一方で、他のクラスの性能を低下させる、クラス依存性を持つことが明らかになった。"
"DropMixと呼ばれる新しい手法を提案し、実験の結果、クラス依存性を軽減しつつ全体的な精度も向上させることができた。"