Основні поняття
提案されたTFMQフレームワークは、拡散モデルの量子化における時間的特徴の乱れを最小限に抑え、4ビットの量子化でほとんど性能劣化を示さず、量子化時間を短縮します。
Анотація
拡散モデルの画像生成における時間的特徴の重要性とその乱れに焦点を当てたTFMQ-DMフレームワークが提案されました。この新しいアプローチは、時間ステップtに関連する一連の活性化値を適切にキャリブレーションし、量子化されたモデルのパフォーマンスを向上させます。実験結果では、他の既存手法と比較してほとんど性能劣化がなく、LSUN-Bedrooms 256×256データセットでFIDスコアを6.71低下させました。また、LSUN-Churches 256×256データセットでは穏やかな改善が見られました。これらの結果は、提案された方法が拡散モデルの量子化において有効であることを示しています。
Статистика
4-bit weight quantization achieves model performance nearly on par with the full-precision model.
Quantization time accelerated by 2.0× on LSUN-Bedrooms 256 × 256 compared to previous works.