이 연구는 Mamba 언어 모델의 사실 회상 메커니즘을 분석하였다. 주요 내용은 다음과 같다:
활성화 패칭 기법을 적용하여 Mamba 모델 내부의 특정 구성 요소들이 사실 회상에 중요한 역할을 하는 것을 확인하였다. 특히 중간 층의 특정 토큰 위치에서 강한 인과 효과가 나타났다.
ROME 기법을 적용하여 Mamba 모델의 다양한 선형 변환 매개변수를 편집함으로써 사실을 성공적으로 삽입할 수 있었다. 이는 변환기 언어 모델에서 관찰된 것과 유사한 패턴을 보였다.
관계 임베딩의 선형성을 분석한 결과, Mamba에서도 많은 사실적 관계가 선형적으로 인코딩되어 있음을 확인하였다.
주의 차단 기법을 Mamba에 적용하는 데에는 어려움이 있었지만, 제한적인 방식으로 적용한 결과 변환기 모델과 유사한 정보 흐름 패턴을 관찰할 수 있었다.
종합적으로 이 연구는 Mamba와 같은 새로운 아키텍처의 언어 모델에도 변환기 모델 분석에 사용된 다양한 해석 기법을 적용할 수 있음을 보여주었다. 두 모델 간에 사실 회상 메커니즘에서 많은 유사점이 발견되었다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문