学生モデルは教師モデルを上回る質の高い出力を生成することがあり、教師-学生のコラボレーションを活用することで、効率的かつ高品質な画像生成が可能になる。
テキスト条件付き拡散モデルにおいて、クロスアテンションは初期の推論ステップでのみ重要であり、後のステップでは冗長となる。このため、クロスアテンションの出力を保存し再利用することで、大幅な推論の高速化が可能となる。