本論文は、大規模ディフュージョンモデルのトレーニングを効率的に行うためのDiffusionPipeシステムを提案している。
まず、ディフュージョンモデルの構造的特徴と特殊なトレーニング手順を考慮して、訓練可能な部分(バックボーン)と非訓練部分の最適な分割と割り当てを動的計画法アルゴリズムで導出する。
次に、非訓練部分の計算をバックボーンのパイプラインのバブル時間に効率的に挿入する手法を提案する。これにより、バブルを完全に埋めることができ、大幅な高速化を実現する。さらに、非訓練部分の一部のバッチサイズを調整することで、バブルに完全に収まらない層にも対応する。
実験の結果、DiffusionPipeは既存のデータ並列トレーニングに比べて最大1.28倍、既存のパイプライン並列手法に比べて最大1.41倍の高速化を達成した。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Ye Tian,Zhen... في arxiv.org 05-03-2024
https://arxiv.org/pdf/2405.01248.pdfاستفسارات أعمق