Core Concepts
가속기 활용을 최대화하기 위한 호스트-드라이버 코드의 효율적 생성과 데이터 전송 최적화의 중요성
Abstract
I. 소개
커스텀 하드웨어 가속기의 중요성
가속기와 호스트 CPU 간 효율적인 통신 필요성
AXI4MLIR을 통한 호스트-드라이버 코드 생성의 중요성
II. 제안된 데이터 전송 최적화
DMA 기반 데이터 할당
DMA 엔진을 통한 데이터 전송을 위한 메모리 할당
데이터 통합
여러 데이터 전송을 단일 DMA 전송 작업으로 통합
소프트웨어 파이프라이닝 및 더블 버퍼링
가속기의 로드, 연산 및 저장 단계를 파이프라인화하여 전체 대기 시간 감소
III. 결론
커스텀 가속기를 위한 호스트-드라이버 코드의 수동 작성은 시간이 많이 소요되고 오류 발생 가능성이 높음
AXI4MLIR은 효율적인 호스트-드라이버 코드 생성을 제공하며, 데이터 관련 최적화를 제안하여 가속기 활용도와 전체 대기 시간을 개선함
Stats
AXI4MLIR은 MLIR 컴파일러 프레임워크를 확장하여 선형 대수 문제를 위한 호스트-드라이버 코드를 생성함
가속기의 계산 코어 활용도가 10% 미만임
데이터 복사로 인한 핵심 대기 병목 현상 식별됨
Quotes
"커스텀 하드웨어 가속기의 성능 향상을 위해 효율적인 호스트-드라이버 코드 생성이 중요하다."
"AXI4MLIR은 선형 대수 문제를 위한 커스텀 가속기에 호스트-드라이버 코드를 생성하는 데 사용된다."