แนวคิดหลัก
다중 축 쿼리를 통해 N:M 희소성 블록 간 가중치 중요도를 고려하고, 점진적 희소화 전략을 적용하여 고성능 N:M 희소성 네트워크를 구축한다.
บทคัดย่อ
이 논문은 N:M 희소성 네트워크의 성능을 향상시키기 위한 효율적인 다중 축 쿼리 기법 MaxQ를 제안한다.
- 다중 축 쿼리:
- N:M 희소성 블록 간 가중치 중요도를 고려하여 소프트 마스크를 생성
- 중요한 가중치를 강화하고 효과적인 업데이트를 보장
- 점진적 희소화 전략:
- 훈련 과정에서 N:M 희소성 블록 비율을 점진적으로 증가
- 희소화로 인한 정보 손실을 최소화하고 안정적인 수렴 달성
실험 결과, MaxQ는 다양한 CNN 아키텍처와 컴퓨터 비전 작업에서 기존 방법 대비 일관된 성능 향상을 보였다. ResNet50에서 1:16 희소성 패턴 적용 시 74.6%의 ImageNet 정확도를 달성하여 기존 최고 성능 대비 2.8% 향상되었다.
สถิติ
ResNet50 1:16 희소성 모델의 ImageNet 정확도는 74.6%이다.
ResNet50 1:16 희소성 모델의 FLOPs는 0.44G이다.
ResNet50 1:16 희소성 모델의 파라미터 수는 3.52M이다.
คำพูด
"N:M 희소성은 구조화된 희소성과 비구조화된 희소성 사이의 성능과 지연 시간 간 더 나은 trade-off를 달성할 수 있는 유망한 솔루션이다."
"기존 N:M 희소성 방법은 블록 간 가중치 중요도를 구분하지 않고 중요한 가중치를 과소평가하며, 전체 네트워크에 N:M 희소성을 직접 적용하여 심각한 정보 손실을 초래한다."