핵심 개념
언어 모델은 현실 세계의 풍부한 시공간 표현을 학습하며 세계 모델의 기본 구성 요소를 갖추고 있다.
초록
대형 언어 모델의 능력이 논란을 불러일으키고 있다.
LLMs가 현실 세계를 반영하는 일관된 공간 및 시간 표현을 학습한다는 증거를 찾았다.
LLMs는 공간 및 시간의 선형 표현을 학습하며 여러 규모에서 일관된 표현을 보여준다.
LLMs는 공간 및 시간에 대한 개별 "공간 뉴런" 및 "시간 뉴런"을 식별한다.
LLMs가 세계 모델의 기본 구성 요소를 갖추고 있다는 강력한 증거를 제공한다.
통계
LLMs는 세계, 미국, 뉴욕시의 공간 데이터셋과 역사적 인물, 예술 작품, 뉴스 헤드라인의 시간 데이터셋의 학습된 표현을 분석한다.
Llama-2 모델 계열에서 선형 회귀 프로브를 훈련하여 실제 세계 위치 또는 시간을 예측한다.
인용구
"LLMs는 세계 및 시간 모델을 형성하는지에 대한 질문을 최대한 실제적으로 다룬다."
"우리의 분석은 미래의 AI 시스템에 대한 강건성, 공정성 및 안전성에 대한 추론을 위해 중요하다."