Core Concepts
量子化された重みの変化度合いを明示的に制御するために、遷移率スケジューリング手法を提案する。従来の学習率スケジューリングでは量子化された重みの変化を適切に制御できないが、提案手法では遷移率を目標値に合わせて更新することで、量子化された重みの変化を効果的に調整できる。
Abstract
本論文は、量子化認識訓練(QAT)における重みの最適化プロセスの問題点を指摘し、それを解決するための新しい手法を提案している。
QATでは、全精度の潜在的重みを量子化された重みに変換して出力を計算する。従来の最適化手法では、潜在的重みの学習率をマニュアルで設定しているが、これでは量子化された重みの変化度合いを適切に制御できない。これは、量子化された重みが離散的なレベルを遷移するタイミングが潜在的重みの分布に依存するためである。
そこで本論文では、量子化された重みの遷移率(TR)を明示的に制御するスケジューリング手法を提案する。具体的には、目標のTRを設定し、それに応じて遷移適応型の学習率(TALR)を動的に調整することで、量子化された重みの変化度合いを適切に制御する。
提案手法は、様々なネットワーク構造やデータセットにおいて、従来手法よりも高い精度を達成している。特に、軽量なモデルや極端な量子化設定で顕著な性能改善が見られ、QATの最適化プロセスにおける提案手法の有効性が示されている。
Stats
量子化された重みが離散的なレベルを遷移するタイミングは、潜在的重みの分布に依存する。
従来の学習率スケジューリングでは、量子化された重みの変化度合いを適切に制御できない。
提案手法では、量子化された重みの遷移率(TR)を目標値に合わせて調整することで、変化度合いを効果的に制御できる。