フレーム理論に基づいた量子化アルゴリズムを提案し、ニューラルネットワークの量子化に適用することで、理論的な誤差評価を行う。
本研究では、ハードウェアリソースの使用を最小限に抑えつつ高精度を維持するための新しい量子化手法であるHGQを提案する。HGQは、重みと活性化の精度を個別に最適化することで、従来の層単位の量子化手法よりも優れた精度とリソース効率のトレードオフを実現する。
制約条件を満たしつつ、ニューラルネットワークのパラメータのビット幅を最適化する手法を提案する。