本論文では、FPGAアーキテクチャをディープラーニング推論に最適化する取り組みについて調査している。
まず、FPGAの特徴であるプログラマビリティ、空間並列性、柔軟性、豊富なI/Oインターフェースなどがディープラーニング推論に適していることを説明する。次に、FPGAでのディープラーニング推論の加速手法として、カスタムハードウェア生成アプローチとオーバーレイアプローチの2つのスタイルを紹介する。
前者は、ディープラーニングモデルの特性に合わせてFPGAアクセラレータを自動生成するものであり、高性能を実現できる。後者は、ソフトウェアプログラマビリティを提供するドメイン特化プロセッサアーキテクチャを構築するものであり、ハードウェア設計の専門知識がなくてもFPGAを活用できる。
さらに、FPGAアーキテクチャの各要素(プログラマブルロジック、DSPブロック、オンチップメモリ、インターポーザ、ネットワークオンチップなど)について、ディープラーニング推論に最適化する機会について議論する。
最後に、FPGAとディープラーニング専用ASICを組み合わせた新しいReconfigurable Acceleration Deviceの可能性にも言及する。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問