ニューラルオーディオコーデックを使用して連続オーディオ信号を離散トークンに量子化すると、同一のオーディオ信号が異なる離散トークン系列にエンコーディングされる問題が発生する。これは離散表現の不整合(Discrete Representation Inconsistency: DRI)と呼ばれ、ニューラルコーデック言語モデルの予測精度を低下させる。