本研究では、多層SAE(MLSAE)を提案した。MLSAEは、変換器の各層の残差ストリーム活性化ベクトルを単一のSAEで学習するものである。これにより、層間の情報フローを直接的に分析できる。
実験の結果、以下のことが明らかになった:
これらの結果から、MLSAEは変換器の情報フローを理解する上で有効な手法であると考えられる。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Tim Lawson, ... ที่ arxiv.org 09-09-2024
https://arxiv.org/pdf/2409.04185.pdfสอบถามเพิ่มเติม