核心概念
データ拡張は一般化に影響を与える隠れたスペクトル正則化を誘発する。
要約
データ拡張(DA)は現代の機械学習における性能向上のための重要なツールであり、一般的なDA戦略がどのように動作するかはしばしば不明確です。本論文では、DAが一般化に及ぼす影響を特徴付ける新しい理論的枠組みを提案しました。この枠組みは、1. 一般的な確率的変換、2. 古典的な過少パラメータ化領域と現代の過多パラメータ化領域、3. 回帰と分類タスク、4. 強力および弱い分布シフト変換に対する一般化解析を可能にします。さらに、我々はDAが暗黙のスペクトル正則化を誘発し、その効果が一般化に及ぼす影響を詳細に説明しました。具体的なDA戦略(ランダムマスキングやカットアウトなど)に対してこの枠組みを適用し、新しいアプローチのテストベッドとして活用しました。
統計
DAは暗黙のスペクトル正則化を誘発する。
DAは一般化エラーに影響する効果を持つ。
引用
"Data augmentation is a powerful workhorse for bolstering performance in modern machine learning."
"Our framework reveals that DA induces implicit spectral regularization through a combination of two distinct effects."
"Our theory reveals good, bad, and ugly sides to DA depending on the setting, nature of task and type of augmentation."