이 논문은 FPGA 아키텍처를 활용한 딥러닝 가속에 대한 현황과 미래 방향을 다룬다.
먼저 FPGA 아키텍처의 기본을 소개하고 딥러닝 애플리케이션에 대한 강점과 약점을 설명한다. 다음으로 FPGA에서 최첨단 성능과 생산성 높은 개발 흐름을 달성하는 다양한 스타일의 딥러닝 추론 가속기를 소개한다. 이는 모델 특화 데이터 흐름 스타일부터 소프트웨어 프로그래밍 가능한 오버레이 스타일까지 다양하다.
이어서 전통적인 FPGA 구성 요소(논리 요소, 산술 회로, 온칩 메모리 등)에 대한 딥러닝 특화 개선 사항과 새로운 딥러닝 전용 블록(텐서 블록 등)을 소개한다. 또한 프로세서와 대규모 가속기 블록을 결합한 하이브리드 디바이스와 패키지 내 딥러닝 칩릿에 대해 설명한다.
마지막으로 딥러닝 분야에서 재구성 가능 디바이스의 미래와 흥미로운 연구 방향을 제시한다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究