핵심 개념
大規模データセットから重要なサンプルのみを選択して蒸留する「プルーニングファースト、蒸留アフター」フレームワークは、従来の手法と比較して、より質の高い蒸留データセットを生成し、特に未知のアーキテクチャに対する汎化性能を大幅に向上させる。
초록
損失値ベースのプルーニングを用いたデータセット蒸留の改善
Moser, B. B., Raue, F., Nauen, T. C., Frolov, S., & Dengel, A. (2024). Distill the Best, Ignore the Rest: Improving Dataset Distillation with Loss-Value-Based Pruning. arXiv preprint arXiv:2411.12115v1.
本研究は、データセット蒸留における従来手法の課題である、未知のアーキテクチャに対する汎化性能の低さを、重要なサンプルのみを選択するプルーニング手法を用いることで解決することを目的とする。