Core Concepts
딥 시퀀스 모델을 사용하여 GPU 컴퓨팅 커널의 최적 튜닝 매개변수를 정확하게 예측할 수 있다.
Abstract
이 연구는 GPU 컴퓨팅 커널의 성능 최적화를 위한 새로운 방법을 제안한다. 일반적으로 GPU 커널의 최적 튜닝 매개변수를 찾기 위해서는 많은 시간과 계산 자원이 필요한 exhaustive 검색이 필요하다. 이 연구에서는 딥 시퀀스 모델을 사용하여 이러한 튜닝 매개변수를 정확하게 예측할 수 있는 방법을 제안한다.
제안된 방법은 다음과 같은 핵심 기여사항을 가진다:
a) 시퀀스-투-시퀀스 모델이 GPU 컴퓨팅 커널의 성능 역학을 정확하게 학습할 수 있음을 제안
b) GPU 커널의 튜닝 매개변수를 예측하는 새로운 네트워크 아키텍처 제안
c) GPU 하드웨어의 물리적 제한과 전문가 지식을 활용하여 검색 공간을 줄이는 제약된 빔 검색 기법 제안
제안된 알고리즘은 AMD의 MIOpen 라이브러리의 다양한 컨볼루션 커널에 대해 90% 이상의 정확도를 달성할 수 있다. 이를 통해 개발 시간과 계산 자원을 줄이고, 사용자 경험을 향상시킬 수 있다.
Stats
GPU 커널은 수백만 번에서 수십억 번 호출될 수 있어 성능이 매우 중요하다.
최적의 튜닝 매개변수를 찾기 위해서는 매개변수 조합의 지수적 증가로 인해 exhaustive 검색이 불가능하다.
Quotes
"GPU 커널은 고성능 컴퓨팅에서 기계 학습에 이르는 다양한 분야에서 중요한 역할을 하고 있다."
"최적의 튜닝 매개변수를 찾기 위한 exhaustive 검색은 계산 자원과 시간이 많이 소요되어 실용적이지 않다."