Core Concepts
매우 작은 행렬 크기에 대한 병렬 대칭 고유값 문제 해결을 위해 통신 회피 및 감소 알고리즘을 제안하였다.
Abstract
이 논문에서는 대규모 병렬 처리 환경에서 매우 작은 행렬에 대한 병렬 대칭 고유값 문제 해결기를 다룬다.
노드당 캐시 크기에 맞는 매우 작은 행렬 크기를 정의하였다.
통신 시간을 최소화하기 위해 MPI 비동기 통신 기반의 통신 회피 및 감소 알고리즘을 제안하였다.
FX10 시스템에서의 성능 평가 결과, (1) MPI 비동기 구현이 기준 구현보다 3배 효율적이며, (2) 하이브리드 MPI 실행이 순수 MPI 실행보다 1.9배 빠르고, (3) 제안한 솔버가 ScaLAPACK 루틴보다 2.3배 및 22배 빠르다.
Stats
현재 초대규모 슈퍼컴퓨터는 150만 개 이상의 코어를 가지고 있다.
노드 당 최대 행렬 크기는 약 1,000 정도로 가정한다.
엑사스케일 컴퓨터의 경우 노드 당 행렬 크기가 약 1,000,000 정도가 될 것으로 예상된다.
Quotes
"현재 수치 라이브러리는 거대 행렬 크기에 맞춰 설계되어 있어 엑사스케일 컴퓨터에는 적합하지 않다."
"노드 관점에서 대상 행렬 크기는 매우 작은 크기로 제한되어야 한다."