最近の研究では、大規模言語モデルの表現空間で高レベルな意味概念が「線形的に」符号化されていると主張されています。この論文では、次トークン予測目的(ソフトマックスと交差エントロピー)と勾配降下法の暗黙のバイアスが共同して概念の線形表現を促進することを示しています。実験は、潜在変数モデルから抽出したデータを学習する際に線形表現が生じることを確認し、この単純な構造でもすでに線形表現が得られることを裏付けています。また、LLaMA-2大規模言語モデルを使用して理論の予測を確認し、この単純なモデルが一般化可能な洞察を提供する証拠も得ました。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Yibo Jiang,G... om arxiv.org 03-07-2024
https://arxiv.org/pdf/2403.03867.pdfDiepere vragen