본 연구는 GPU 기반 RT-TDDFT 애플리케이션의 복잡한 튜닝 검색 문제를 해결하기 위한 효율적인 방법론을 제안한다.
먼저, 도메인 전문가의 지식을 활용하여 검색 공간을 제한하고 튜닝 비용 예산을 설정한다. 이후 민감도 분석과 통계 분석을 통해 튜닝 파라미터와 런타임에 대한 통찰을 얻는다.
다음으로, 민감도 분석을 활용하여 튜닝 루틴 간의 상호 의존성을 추론한다. 이를 바탕으로 독립적인 검색과 통합 검색을 적절히 조합하여 실행한다. 통합 검색의 경우 차원 수를 10 이하로 제한하여 효율적인 탐색이 가능하도록 한다.
제안된 방법론을 합성 함수와 GPU 기반 RT-TDDFT 애플리케이션에 적용한 결과, 기존의 완전 독립 검색이나 완전 통합 검색 대비 최대 8%의 성능 향상과 최대 95%의 검색 시간 단축을 달성할 수 있었다. 이를 통해 제안 방법론의 효과성과 적용 가능성을 입증하였다.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询