Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
言語モデル解釈可能性
言語モデルの振る舞いを説明するための回路の忠実性を高める
回路の忠実性、つまり回路外の要素を除去しても言語モデルの振る舞いが変わらないことが、回路研究の正当性を示す。本研究では、回路の忠実性を高める新しい手法を提案し、既存手法との比較を行う。
1