이 연구는 레이어 제거를 통한 로터리 티켓 가설을 탐구한다. 먼저 레이어 제거 과정에서도 당첨 티켓이 존재함을 확인했다. 이를 바탕으로 초기화 시 이러한 당첨 티켓을 발견하는 체계적인 전략을 제안했다. 이를 통해 과도하게 매개변수화된 밀집 네트워크를 학습할 필요 없이 희소 서브네트워크로 대체할 수 있어 학습 시간과 탄소 배출을 크게 줄일 수 있다. 또한 이 당첨 티켓은 적대적 예시와 분포 외 예시에 대한 강건성도 보여준다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Artur Jordao... alle arxiv.org 03-20-2024
https://arxiv.org/pdf/2301.10835.pdfDomande più approfondite