Основні поняття
COnfLUX 알고리즘의 통신 대역폭 상한이 원 논문에서 제시한 것보다 더 높을 수 있으며, 실험 방법과 하한 도출에도 잠재적인 문제가 있음을 지적한다.
Анотація
이 논문은 Kwasniewski 등이 제안한 COnfLUX 2.5D LU 분해 알고리즘을 재검토한다. 주요 발견사항은 다음과 같다:
-
통신 대역폭 상한 분석:
- COnfLUX 알고리즘이 A10 및 A01 영역(패널 분해 및 TRSM)에서 1D 분해를 사용하여 모든 프로세서의 통신 능력을 충분히 활용하지 못하는 것으로 보인다.
- 이로 인해 원 논문의 상한 분석이 실제 비용을 과소평가했을 가능성이 있다.
- 수정된 분석에 따르면 COnfLUX의 통신 대역폭 비용은 Ω(n^2/p^(1/2)) 또는 Ω(n^2/p^(1/3))으로, 원 논문의 주장보다 더 높다.
-
실험 방법의 문제:
- 원 코드베이스 분석 결과, 저자들은 통신 최적화 구성(p^(1/3) × p^(1/3) × p^(1/3))을 테스트하지 않고 다른 구성만을 평가했다.
- 이는 COnfLUX의 통신 최적성 주장에 의문을 제기할 수 있다.
-
하한 도출의 문제:
- 하한 도출 과정이 병렬 계산에서 I/O 연산 총량이 프로세서 수에 비례하여 증가한다는 점을 고려하지 않았다.
- 또한 모든 프로세서가 항상 계산에 참여하지 않는다는 점도 간과했다.
이러한 발견을 통해 COnfLUX 알고리즘과 병렬 행렬 분해 알고리즘 개발에 대한 이해를 높이고자 한다.
Статистика
(n - tv)vc / p^(1/2)_1 c = (n - tv)v / p^(1/2)_1
Σ(n/v)_t=1 (n - tv)v / p^(1/2)_1 = O(n^2 / p^(1/2))