Core Concepts
인덕션 회로는 이전 토큰을 매칭하고 복사하는 작업을 수행하며, 이러한 회로의 형성 과정에는 세 가지 상호작용하는 하위 회로가 관여한다.
Abstract
이 연구는 인덕션 회로의 형성 동역학을 분석했다. 주요 내용은 다음과 같다:
인덕션 헤드는 다중으로 형성되며, 이들은 상호 보완적으로 작용한다. 단일 헤드만으로도 과제를 해결할 수 있지만, 다중 헤드를 사용하면 학습 속도가 더 빨라진다.
이전 토큰 헤드와 인덕션 헤드 간의 연결은 다대다 관계이다.
인덕션 회로의 형성은 세 가지 상호작용하는 하위 회로에 의해 결정된다:
하위 회로 A: 이전 토큰에 주목하고 이를 복사하는 과정
하위 회로 B: 인덕션 헤드에서 쿼리와 키를 매칭하는 과정
하위 회로 C: 입력 레이블을 출력으로 복사하는 과정
이 세 하위 회로의 상호작용이 인덕션 회로 형성의 불연속적인 위상 변화를 야기한다.
데이터 특성(클래스 수, 레이블 수)에 따라 각 하위 회로의 학습 속도가 달라지며, 이를 통해 위상 변화 시점의 변화를 설명할 수 있다.
Stats
인덕션 헤드의 강도는 정답 레이블 토큰에 대한 주의 가중치에서 오답 레이블 토큰에 대한 주의 가중치를 뺀 값으로 정의된다.
인덕션 헤드 중 Head 3이 가장 강하고 가장 먼저 형성된다.
Quotes
"인덕션 회로는 이전 토큰을 매칭하고 복사하는 작업을 수행한다."
"인덕션 회로의 형성은 세 가지 상호작용하는 하위 회로에 의해 결정된다."