언어 모델의 매개변수 지식 공개: 귀속 방법에 대한 통합 프레임워크
언어 모델은 학습 과정에서 매개변수 지식을 습득하며, 이는 모델의 가중치 내에 내재되어 있다. 하지만 언어 모델의 확장성이 증가함에 따라 모델의 내부 작동 원리를 이해하고 이 내재된 지식을 큰 비용 없이 업데이트하거나 수정하는 것이 중요한 과제가 되었다. 이 연구는 인스턴스 귀속(IA)과 뉴런 귀속(NA) 방법을 통해 언어 모델에 내재된 지식을 공개하고 이를 체계적으로 비교하는 새로운 평가 프레임워크를 제안한다.