本研究では、多層SAE(MLSAE)を提案した。MLSAEは、変換器の各層の残差ストリーム活性化ベクトルを単一のSAEで学習するものである。これにより、層間の情報フローを直接的に分析できる。
実験の結果、以下のことが明らかになった:
これらの結果から、MLSAEは変換器の情報フローを理解する上で有効な手法であると考えられる。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Tim Lawson, ... pada arxiv.org 09-09-2024
https://arxiv.org/pdf/2409.04185.pdfPertanyaan yang Lebih Dalam