核心概念
레이어 제거를 통해 초기화 시 모든 티켓이 당첨되는 희소 서브네트워크를 발견할 수 있다.
摘要
이 연구는 레이어 제거를 통한 로터리 티켓 가설을 탐구한다. 먼저 레이어 제거 과정에서도 당첨 티켓이 존재함을 확인했다. 이를 바탕으로 초기화 시 이러한 당첨 티켓을 발견하는 체계적인 전략을 제안했다. 이를 통해 과도하게 매개변수화된 밀집 네트워크를 학습할 필요 없이 희소 서브네트워크로 대체할 수 있어 학습 시간과 탄소 배출을 크게 줄일 수 있다. 또한 이 당첨 티켓은 적대적 예시와 분포 외 예시에 대한 강건성도 보여준다.
統計資料
제안한 방법으로 ResNet32와 ResNet56 모델에서 최대 2배 학습 속도 향상과 51% 탄소 배출 감소를 달성했다.
제안한 당첨 티켓은 적대적 예시에 대해 최대 3.73%p 높은 강건성을 보였다.
제안한 당첨 티켓은 분포 외 예시에 대해 ResNet56에서 최대 1.75%p 높은 일반화 성능을 보였다.
引述
"레이어 제거를 통해 초기화 시 모든 티켓이 당첨되는 희소 서브네트워크를 발견할 수 있다."
"제안한 당첨 티켓은 학습 시간과 탄소 배출을 크게 줄일 수 있으며, 적대적 예시와 분포 외 예시에 대한 강건성도 보여준다."