本研究では、多層SAE(MLSAE)を提案した。MLSAEは、変換器の各層の残差ストリーム活性化ベクトルを単一のSAEで学習するものである。これにより、層間の情報フローを直接的に分析できる。
実験の結果、以下のことが明らかになった:
これらの結果から、MLSAEは変換器の情報フローを理解する上で有効な手法であると考えられる。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Tim Lawson, ... alle arxiv.org 09-09-2024
https://arxiv.org/pdf/2409.04185.pdfDomande più approfondite