Core Concepts
ディフュージョンモデルの効率的な画像生成のために、分布に応じた量子化関数と最適なキャリブレーション画像生成手法を提案する。
Abstract
本論文では、ディフュージョンモデルの効率的な画像生成のために、高精度な学習後量子化フレームワークを提案している。
従来の量子化手法は、ディフュージョンモデルの各タイムステップで大きく異なる活性化分布に対して共通の量子化関数を使用していたため、大きな量子化誤差が生じていた。また、ランダムに選択したタイムステップでキャリブレーション画像を生成していたため、量子化関数の一般化性が低かった。
本手法では、以下の2つの改善点を提案している:
分布に応じた量子化: ディフュージョンモデルの各タイムステップの活性化分布に合わせて、個別の量子化関数を割り当てる。これにより、大幅な量子化誤差の低減を実現する。
最適なキャリブレーション画像生成: 構造的リスク最小化の原理に基づき、最適なタイムステップを選択してキャリブレーション画像を生成する。これにより、量子化関数の一般化性が向上する。
実験結果から、提案手法は従来手法と比べて、同等の計算コストで大幅な画質向上を実現できることが示された。特に、低ビット幅の量子化モデルにおいて顕著な性能改善が確認された。
Stats
ディフュージョンモデルの各タイムステップの活性化分布が大きく異なるため、共通の量子化関数を使用すると大きな量子化誤差が生じる。
ランダムに選択したタイムステップでキャリブレーション画像を生成すると、量子化関数の一般化性が低下する。
Quotes
分布に応じた量子化関数と最適なキャリブレーション画像生成手法を提案することで、ディフュージョンモデルの効率的な画像生成を実現できる。