本論文では、言語モデルの学習効率に対する重複サブワードの影響を調査している。
まず、完全に等価な重複サブワードを人工的に生成し、言語モデルの学習効率がどの程度低下するかを検証した。その結果、完全に等価な重複サブワードが全体の17%存在する場合、言語モデルの学習効率は約15%低下することが分かった。
次に、実際の言語モデルの語彙に含まれる近似重複サブワードについて調査した。近似重複サブワードを統合すると、言語モデルの性能が低下することが分かった。これは、実際の近似重duplicate サブワードは完全に等価ではなく、その違いが重要な情報を失わせてしまうためと考えられる。
さらに、近似重複サブワードの存在が言語モデルの入力側と出力側の両方に影響を及ぼすことを示した。特に、入力文脈に近似重複サブワードが多く含まれる場合、言語モデルの予測精度が低下する傾向にある。
最後に、近似重複サブワードの違いを学習可能な特別な埋め込みを導入することで、性能の低下を一部緩和できることを示した。しかし、完全に等価な重複サブワードの場合ほどの効果は得られなかった。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Anto... : arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06508.pdfDaha Derin Sorular