المفاهيم الأساسية
복잡한 RT-TDDFT 응용 프로그램의 성능 최적화를 위해 파라미터 간 상호 의존성을 효과적으로 분석하고 이를 바탕으로 최적의 튜닝 검색 전략을 수립한다.
الملخص
이 논문은 고성능 컴퓨팅(HPC) 환경에서 실행되는 Real-Time Time-Dependent Density Functional Theory(RT-TDDFT) 응용 프로그램의 복잡한 튜닝 검색 문제를 다룹니다.
- 도메인 전문가의 지식을 활용하여 검색 공간을 제한하고 튜닝 검색의 최대 비용을 정의합니다.
- 민감도 분석과 통계 분석을 통해 튜닝 파라미터와 런타임에 대한 통찰을 얻습니다.
- 루틴 간 상호 의존성을 찾기 위해 민감도 분석을 수행합니다. 이를 통해 독립적인 검색과 상호 의존적인 검색을 구분할 수 있습니다.
- 상호 의존적인 검색은 통합하여 수행하고, 파라미터 수를 10개 이하로 제한합니다.
- 동일한 커널이 여러 영역에서 사용되는 경우, 가장 큰 영향을 미치는 영역의 파라미터 값을 사용합니다.
이러한 방법론을 통해 Bayesian 최적화 기반의 전체 독립 검색 또는 전체 통합 검색 대비 최대 8% 더 정확한 구성을 찾을 수 있었고, 검색 시간을 최대 95%까지 단축할 수 있었습니다. RT-TDDFT 응용 프로그램에 적용한 결과, 효과적인 튜닝 검색을 수행할 수 있었습니다.
الإحصائيات
nstb는 Case Study 1에서 전체 런타임 변동성의 21.71%를 차지하고, Case Study 2에서는 39%를 차지합니다.
nkpb는 Case Study 2에서 전체 런타임 변동성의 61%를 차지합니다.
nbatches는 Case Study 1에서 2.46%, Case Study 2에서 16%의 변동성을 보입니다.
nstreams는 Case Study 1에서 2.11%, Case Study 2에서 2%의 변동성을 보입니다.
اقتباسات
"Tuning searches are pivotal in High-Performance Computing (HPC), addressing complex optimization challenges in computational applications."
"The complexity arises not only from finely tuning parameters within routines but also potential interdependencies among them, rendering traditional optimization methods inefficient."
"Our methodology adapts and refines these methods to ensure computational feasibility while maximizing performance gains in real-world scenarios."