本論文は、大規模ディフュージョンモデルのトレーニングを効率的に行うためのDiffusionPipeシステムを提案している。
まず、ディフュージョンモデルの構造的特徴と特殊なトレーニング手順を考慮して、訓練可能な部分(バックボーン)と非訓練部分の最適な分割と割り当てを動的計画法アルゴリズムで導出する。
次に、非訓練部分の計算をバックボーンのパイプラインのバブル時間に効率的に挿入する手法を提案する。これにより、バブルを完全に埋めることができ、大幅な高速化を実現する。さらに、非訓練部分の一部のバッチサイズを調整することで、バブルに完全に収まらない層にも対応する。
実験の結果、DiffusionPipeは既存のデータ並列トレーニングに比べて最大1.28倍、既存のパイプライン並列手法に比べて最大1.41倍の高速化を達成した。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询