Grunnleggende konsepter
딥 신경망 내의 중복 계산 블록을 식별하고, 이를 단순화된 변환으로 대체하여 모델의 효율성을 향상시키는 방법론 제시
Sammendrag
신경망에서 중복 계산 블록 감지 및 근사화
본 연구 논문에서는 딥 신경망(DNN)의 효율성을 향상시키기 위해 내부 표현 유사성을 활용하여 중복 계산 블록을 감지하고 근사화하는 방법을 제안합니다.
본 연구는 다음 두 가지 주요 질문에 답하고자 합니다. 첫째, 신경망 내에서 중복되는 블록을 어떻게 식별할 수 있을까요? 둘째, 네트워크의 최종 표현과 전체 기능을 유지하면서 이러한 블록을 효과적으로 근사화하려면 어떻게 해야 할까요?
본 연구에서는 블록 중복성(BR)이라는 새로운 지표를 도입하여 신경망 내에서 중복되는 블록을 식별합니다. BR은 두 블록의 출력 표현 간의 변화 정도를 측정하여 높은 점수는 두 블록 간의 출력 변화가 미미하여 두 번째 블록이 중복될 수 있음을 나타내고, 낮은 점수는 두 번째 블록이 최종 예측에 상당히 기여함을 의미합니다. 중복 블록을 식별한 후에는 모델의 복잡성과 매개변수 수를 줄이기 위해 모델을 재구성합니다. 이러한 중복 블록은 3,000개의 학습 샘플을 기반으로 모든 토큰에 적용되는 공유 선형 변환을 사용하여 근사화됩니다.