核心概念
CIFAR-10データセットに対して、単一NVIDIA A100 GPUで94%の精度を3.29秒で達成する高速な学習手法を提案する。さらに、95%精度を10.4秒、96%精度を46.3秒で達成する手法も開発した。
要約
本論文では、CIFAR-10データセットに対する高速な学習手法を提案している。主な内容は以下の通りである:
従来の最高記録を大幅に上回る、単一NVIDIA A100 GPUで94%精度を3.29秒で達成する手法を開発した。
さらに、95%精度を10.4秒、96%精度を46.3秒で達成する手法も開発した。
提案手法の中核となる要素は以下の通り:
修正版のパッチホワイトニング初期化
アイデンティティ初期化
学習率とバイアスの最適化
Lookahead最適化
多クロップ評価
提案する「交互反転」データ拡張手法
提案手法の性能向上は、各要素の効果が概ね加算的に現れることを示した。
提案手法は、CIFAR-100、SVHN、CINIC-10などの他のデータセットでも良好な汎化性能を示した。
統計
94%精度を3.29秒で達成するモデルは、3.6 × 10^14 FLOPsを消費する。
95%精度を10.4秒で達成するモデルは、1.4 × 10^15 FLOPsを消費する。
96%精度を46.3秒で達成するモデルは、7.2 × 10^15 FLOPsを消費する。
引用
「CIFAR-10は機械学習分野で最も広く使用されるデータセットの1つであり、年間数千件の研究プロジェクトに活用されている。」
「これらの学習手法を使えば、Ilyas et al. (2022)やJordan (2023)のような大規模な研究プロジェクトを、より少ない計算リソースで実行できるようになる。」