Core Concepts
DG-RePlAceは、機械学習アクセラレータの固有のデータフローとデータパス構造を活用することで、高速かつ高品質なグローバルプレースメントを実現する。
Abstract
本論文では、DG-RePlAceと呼ばれる新しい高速GPU加速グローバルプレースメントフレームワークを提案する。DG-RePlAceは、機械学習アクセラレータの固有のデータフローとデータパス構造を活用することで、高速かつ高品質なグローバルプレースメントを実現する。
具体的には以下の3つの主要な特徴を持つ:
物理階層抽出により、データフロー情報をネットリストに組み込む。これにより、関連する要素が近接して配置されるようにする。
2D PE配列のデータパス構造に合わせた疑似ネット制約を導入する。これにより、データパスの整合性が保たれる。
GPU並列化された解析的配置アルゴリズムを採用し、高速化を図る。特に、ワイヤ長勾配計算アルゴリズムを新たに提案し、DREAMPlaceに比べて3.25倍高速化を実現する。
実験結果では、DG-RePlAceがRePlAceおよびDREAMPlaceと比較して、平均10%および7%のルーティングワイヤ長の削減、31%および34%のTNS(Total Negative Slack)の改善を達成することを示している。また、グローバルプレースメントの実行時間はDREAMPlaceの1.75倍高速である。さらに、大規模な非機械学習ベンチマークでも優れた性能を発揮することを確認した。
Stats
ルーティングワイヤ長は、RePlAceと比べて平均10%、DREAMPlaceと比較して平均7%削減された。
TNSは、RePlAceと比べて平均31%、DREAMPlaceと比較して平均34%改善された。
グローバルプレースメントの実行時間は、DREAMPlaceの1.75倍高速であった。
Quotes
「DG-RePlAceは、機械学習アクセラレータの固有のデータフローとデータパス構造を活用することで、高速かつ高品質なグローバルプレースメントを実現する。」
「DG-RePlAceは、RePlAceおよびDREAMPlaceと比較して、平均10%および7%のルーティングワイヤ長の削減、31%および34%のTNSの改善を達成する。」
「DG-RePlAceのグローバルプレースメントの実行時間は、DREAMPlaceの1.75倍高速である。」