核心概念
Transformerは、従来のRNNとは異なり、誘導的なカウント能力を獲得するために適切な帰納的バイアスを必要とする。
要約
Transformerにおける誘導的カウント能力:帰納的バイアスの必要性
本稿は、Transformerが誘導的なカウント能力を獲得できるかどうかを実証的に検証した研究論文である。
Transformerが、従来のRNNのように、明示的な再帰メカニズムなしに誘導的なカウント能力を獲得できるかどうかを検証する。
1層、2層、4層のTransformerを用いて、様々なカウントタスク(Vanilla、Modular、Selectiveなど)を学習させた。
異なるPositional Embedding(PE)手法(NoPE、SinePE、APE、RoPE、SPE)を採用し、その影響を分析した。
従来のRNN(RNN、LSTM)と最新のRNN(S4、Mamba、RWKV)についても同様の実験を行い、Transformerとの比較を行った。