Core Concepts
최근 메모리 바운드 DNN 모델의 증가로 인해 DNN 가속기에서 연산 간 파이프라이닝이 중요한 최적화 기법으로 부상하고 있다. 본 논문은 파이프라인 깊이와 세부 단계의 조절을 통해 다양한 DNN 모델에 효율적으로 적용할 수 있는 PIPEORGAN이라는 새로운 공간 구성 전략을 제안한다.
Abstract
본 논문은 DNN 가속기에서 연산 간 파이프라이닝의 중요성을 강조한다. 최근 메모리 바운드 DNN 모델의 증가로 인해 연산 간 파이프라이닝이 중요한 최적화 기법으로 부상하고 있다.
연산 간 파이프라이닝의 성능은 두 가지 핵심 요소에 크게 의존한다. 첫째, 파이프라인 깊이, 즉 동시에 파이프라이닝되는 연산의 수이다. 이는 활성화 대 가중치 비율과 skip 연결에 따라 달라진다. 둘째, 파이프라인 세부 단계의 크기, 즉 생산자 연산이 생성한 중간 결과의 소비자 연산에 의한 소비 크기이다.
기존 연구들은 이러한 요소들을 충분히 고려하지 않았다. 본 논문은 PIPEORGAN이라는 새로운 공간 구성 전략을 제안한다. PIPEORGAN은 파이프라인 깊이와 세부 단계 크기를 유연하게 조절할 수 있다. 또한 다양한 공간 구성 전략을 제시하여 연산 간 파이프라이닝의 성능과 에너지 효율을 높인다.
구체적으로, 본 논문은 다음과 같은 내용을 다룬다:
활성화 대 가중치 비율과 skip 연결이 파이프라인 깊이와 세부 단계 크기에 미치는 영향을 분석한다.
다양한 공간 구성 전략을 제안하고, 이에 따른 통신 패턴과 병목 현상을 분석한다.
기존 메시 토폴로지의 한계를 극복하기 위해 AMP라는 개선된 토폴로지를 제안한다.
PIPEORGAN과 AMP를 XR-bench 벤치마크에 적용하여 1.95배의 성능 향상을 달성한다.
Stats
활성화 대 가중치 비율은 XR-bench 모델에서 10^-3에서 10^3 사이의 범위를 가진다.
XR-bench 모델에는 다양한 밀도와 재사용 거리의 skip 연결이 존재한다.
Quotes
"최근 메모리 바운드 DNN 모델의 증가로 인해 DNN 가속기에서 연산 간 파이프라이닝이 중요한 최적화 기법으로 부상하고 있다."
"연산 간 파이프라이닝의 성능은 파이프라인 깊이와 세부 단계 크기에 크게 의존한다."
"PIPEORGAN은 파이프라인 깊이와 세부 단계 크기를 유연하게 조절할 수 있는 새로운 공간 구성 전략을 제안한다."