高圧縮テキストを用いて大規模言語モデルを効率的に学習する方法を提案する。従来の単語分割トークナイザーでは限界があるため、ニューラルネットワークを用いた高圧縮手法を活用することで、学習効率と推論速度の向上が期待できる。