이 논문은 ARM 프로세서에서 메모리 중심 프로파일링을 수행하는 도구인 NMO를 소개한다. NMO는 메모리 대역폭 및 용량 사용량 추적과 더불어 ARM의 통계적 프로파일링 확장(SPE)을 활용하여 메모리 영역 기반 프로파일링을 제공한다.
NMO는 ARM Ampere 프로세서에서 5개의 벤치마크와 애플리케이션(STREAM, CFD, BFS, PageRank, In-memory Analytics)을 평가했다. 결과는 ARM SPE의 시간 오버헤드와 샘플링 정확도를 다양한 샘플링 주기와 보조 버퍼 크기에서 정량적으로 평가했다.
3000-4000 샘플링 주기에서 ARM SPE 프로파일링은 0.2%-3.3%의 시간 오버헤드에서 94% 이상의 최고 정확도를 달성했다. 2000 미만의 높은 샘플링 주기는 샘플 손실과 낮은 정확도를 초래했다. 16-32페이지(각 64KB)의 보조 버퍼 크기가 테스트 애플리케이션에서 최적의 오버헤드와 정확도를 보였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Samuel Miksi... at arxiv.org 10-03-2024
https://arxiv.org/pdf/2410.01514.pdfDeeper Inquiries