Основные понятия
채널 유사성을 활용하여 데이터 없이도 효과적으로 신경망 모델을 압축할 수 있는 방법을 제안한다.
Аннотация
이 논문은 데이터 없이도 효과적으로 신경망 모델을 압축할 수 있는 AutoDFP(Automatic Data-Free Pruning) 방법을 제안한다. 기존의 데이터 기반 압축 방법은 데이터 가용성과 프라이버시 문제로 인해 제한적이었다.
AutoDFP는 채널 간 유사성에 착안하여 채널 선택과 재구축을 자동으로 수행한다. 구체적으로:
- 채널 유사성 평가를 통해 각 층의 상태를 파악하고,
- 강화학습 에이전트를 활용하여 각 층의 최적 압축률과 재구축 계수를 자동으로 결정한다.
실험 결과, AutoDFP는 다양한 신경망 구조와 데이터셋에서 기존 데이터 프리 압축 방법 대비 우수한 성능을 보였다. 예를 들어 CIFAR-10 데이터셋의 VGG-16 모델에서 2.87%의 정확도 향상을, ImageNet 데이터셋의 MobileNet-V1 모델에서 43.17%의 정확도 향상을 달성했다.
Статистика
VGG-16 모델에서 30% 압축 시 정확도가 65.77%에서 92.94%로 57.11% 향상되었다.
ResNet-56 모델에서 60% 압축 시 정확도가 76.56%에서 85.48%로 39.04% 향상되었다.
MobileNet-V1 모델에서 20% 압축 시 정확도가 37.23%에서 86.50%로 72.60% 향상되었다.
ResNet-34 모델에서 70% 압축 시 정확도가 39.28%에서 58.47%로 41.41% 향상되었다.
ResNet-50 모델에서 70% 압축 시 정확도가 24.63%에서 41.83%로 37.55% 향상되었다.
MobileNet-V1 모델에서 80% 압축 시 정확도가 15.56%에서 58.73%로 57.46% 향상되었다.
Цитаты
"채널 간 유사성을 활용하여 프루닝 시 손실된 정보를 부분적으로 보상할 수 있다는 가정에 기반한다."
"강화학습 에이전트를 활용하여 각 층의 최적 압축률과 재구축 계수를 자동으로 결정한다."