本研究では、大規模な画像データセットから効率的にデータセットを蒸留する手法を提案している。従来の手法は、実画像とのマッチングに焦点を当てていたが、合成画像の品質が低く、蒸留に時間がかかるという課題があった。
提案手法では、クラス条件付き拡散モデルを用いて合成画像を生成する。拡散モデルは、ノイズを徐々に付与して画像を劣化させ、その逆過程で高品質な合成画像を生成することができる。この手法により、人間が理解可能な合成画像を短時間で大量に生成できる。
実験では、CIFAR100とTinyImageNetデータセットを用いて提案手法を評価した。その結果、従来手法を大幅に上回る性能を示し、The First Dataset Distillation Challengeのトラック2で1位を獲得した。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Zhe Li, Weit... في arxiv.org 09-09-2024
https://arxiv.org/pdf/2409.03929.pdfاستفسارات أعمق