핵심 개념
모델 내의 정보 흐름 경로를 자동으로 추출하여 언어 모델의 동작을 이해하고 해석하는 방법을 제안합니다.
통계
모델의 중요한 부분을 추출하기 위해 그래프를 자동으로 구축합니다.
중요한 서브그래프를 상향식으로 구축하여 정보를 추출합니다.
모델의 중요한 구성 요소를 식별하고 분석합니다.
실험 결과를 통해 모델의 특정 부분이 특정 도메인에 특화되어 있음을 확인합니다.
인용구
"우리의 방법은 기존의 워크플로우에 비해 훨씬 더 빠르고 다양한 정보를 제공합니다."
"정보 흐름 경로를 추출하여 모델의 동작을 이해하고 해석하는 방법을 제안합니다."