이 논문은 Intel Xeon Phi KNL 프로세서를 위해 개발된 Floyd-Warshall 알고리즘 코드를 x86 프로세서에서 실행할 수 있도록 적응시킨 내용을 다룬다.
먼저, 원본 코드에 적용된 다양한 최적화 기법들을 하나씩 검증하고 필요한 조정을 수행하였다. 이를 통해 Intel Core i5와 Intel Xeon Platinum 서버에서의 성능을 분석하였다.
추가로, 병렬 알고리즘의 동시성 수준을 높이기 위한 새로운 최적화 기법을 제안하였다. 이 기법은 세마포어와 조건 변수 두 가지 동기화 메커니즘을 사용하여 구현되었다. 실험 결과, 제안된 최적화 기법은 최대 23%의 성능 향상을 달성하였다.
전반적으로, 모든 최적화 기법들이 두 x86 플랫폼에서 유익했으며, 특히 SIMD 명령어 사용이 가장 큰 성능 향상을 가져왔다. 또한 데이터 유형과 문제 크기에 따라 성능 차이가 관찰되었다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies