تنزيل Linnk AI
•
مساعد بحث
>
سجل دخولك
رؤى
-
言語モデル解釈可能性
言語モデルの振る舞いを説明するための回路の忠実性を高める
回路の忠実性、つまり回路外の要素を除去しても言語モデルの振る舞いが変わらないことが、回路研究の正当性を示す。本研究では、回路の忠実性を高める新しい手法を提案し、既存手法との比較を行う。
1