大規模言語モデル(LLM)のメモリと計算の需要を削減するために、新しい二値化手法であるARB-LLMが提案された。ARB-LLMは、二値化重みと完全精度重みの間の分布のずれを、交互に精緻化された二値化(ARB)アルゴリズムを用いることで解消し、量子化誤差を大幅に削減する。