核心概念
ARM 프로세서의 다단계 메모리 프로파일링 도구를 설계하고, ARM SPE를 활용하여 메모리 접근 패턴을 분석하고 정량적으로 평가한다.
要約
이 논문은 ARM 프로세서에서 메모리 중심 프로파일링을 수행하는 도구인 NMO를 소개한다. NMO는 메모리 대역폭 및 용량 사용량 추적과 더불어 ARM의 통계적 프로파일링 확장(SPE)을 활용하여 메모리 영역 기반 프로파일링을 제공한다.
NMO는 ARM Ampere 프로세서에서 5개의 벤치마크와 애플리케이션(STREAM, CFD, BFS, PageRank, In-memory Analytics)을 평가했다. 결과는 ARM SPE의 시간 오버헤드와 샘플링 정확도를 다양한 샘플링 주기와 보조 버퍼 크기에서 정량적으로 평가했다.
3000-4000 샘플링 주기에서 ARM SPE 프로파일링은 0.2%-3.3%의 시간 오버헤드에서 94% 이상의 최고 정확도를 달성했다. 2000 미만의 높은 샘플링 주기는 샘플 손실과 낮은 정확도를 초래했다. 16-32페이지(각 64KB)의 보조 버퍼 크기가 테스트 애플리케이션에서 최적의 오버헤드와 정확도를 보였다.
統計
메모리 대역폭 사용량 최대 120 GiB/s
메모리 용량 사용량 최대 123.8 GiB
引用
"ARM 프로세서가 HPC 시스템과 데이터 센터에 등장하면서 x86 기계의 강력한 경쟁자로 부상하고 있다."
"메모리 중심 프로파일링은 메모리 접근 병목 현상을 분석하고 최적화 방향을 제시하는 중요한 접근법이다."