Kernekoncepter
본 논문에서는 훈련 중에 심층 신경망의 유닛/필터 및 레이어를 동시에 효율적으로 가지치기하여 예측 정확도를 유지하면서 계산 및 매개변수 복잡성을 최적화하는 새로운 알고리즘을 제안합니다.
Resumé
심층 신경망 가지치기를 위한 복잡도 인지 훈련 알고리즘: 연구 논문 요약
참고문헌: Frank, V., Guenter, I., & Sideris, A. (2024). Complexity-Aware Training of Deep Neural Networks for Optimal Structure Discovery. arXiv preprint arXiv:2411.09127.
본 연구 논문은 심층 신경망 (DNN)의 크기와 계산 복잡성을 줄이기 위해 훈련 중에 유닛/필터 및 레이어 가지치기를 동시에 수행하는 새로운 알고리즘을 제안합니다. 이 알고리즘은 예측 정확도를 유지하면서 계산 및 매개변수 복잡성을 최적화하는 최적의 네트워크 구조를 찾는 것을 목표로 합니다.
본 논문에서는 네트워크의 유닛과 레이어를 스케일링하는 변분 베르누이 분포의 매개변수와 네트워크 가중치에 대한 확률적 최적화 문제의 해로 최적의 네트워크 구조를 찾습니다. 변분 매개변수가 0으로 수렴하면 해당 구조가 영구적으로 비활성화되어 가지치기가 발생하여 훈련 및 예측 중에 계산량을 줄입니다. 특히, 예측 정확도와 네트워크 가지치기 목표를 계산/매개변수 복잡성 인식 방식으로 결합한 비용 함수를 정의하고 여러 정규화 매개변수를 자동으로 선택하는 새로운 접근 방식을 제안합니다.