核心概念
Diffusion Transformer(DiT)の推論を高速化するために、Sequence Parallelism、PipeFusion、CFG Parallelismといった複数の並列化手法を組み合わせたハイブリッド並列化エンジンxDiTが提案されている。
要約
xDiT: 大規模並列化によるDiffusion Transformer向け推論エンジン
本稿は、高品質な画像や動画生成を可能にするDiffusion Transformer(DiT)の推論を高速化するための、新しい並列化エンジンxDiTに関する研究論文の要約です。
近年、Diffusion Modelは画像や動画生成において革新的な技術として注目されています。特に、従来のU-NetアーキテクチャからDiffusion Transformer(DiT)への移行が進んでいます。DiTは優れたモデル容量とスケーラビリティを備えていますが、高品質なコンテンツ生成には長いシーケンス長が必要となり、Attention機構の計算量が指数関数的に増加し、DiTの推論レイテンシが増大するという課題があります。
DiTの推論を高速化するために、複数の計算デバイスを用いた並列化が必須となります。しかし、既存の並列化手法は、単一の手法では大規模化に対応できない、DiTモデルアーキテクチャの多様性に対応できないといった課題を抱えています。