Główne pojęcia
본 논문에서는 인간의 읽기 시간을 예측하는 능력을 향상시키기 위해 언어 모델을 인간의 심리 측정 데이터에 맞춰 미세 조정하는 새로운 기술을 제안합니다.
Streszczenie
언어 모델과 인간 읽기 시간 정렬: 새로운 미세 조정 기술
본 연구 논문에서는 인간의 읽기 시간을 보다 정확하게 예측하기 위해 언어 모델을 인간의 심리 측정 데이터에 정렬하는 새로운 기술을 소개합니다. 저자들은 언어 모델이 인간의 인지 과정을 얼마나 잘 모델링할 수 있는지에 대한 이전 연구들을 언급하며, 이 연구에서는 언어 모델을 인간의 심리 측정 데이터에 정렬하여 유용한 인지 모델로 직접 최적화할 수 있는지에 대한 역 질문을 제기합니다.
본 연구의 주요 목표는 언어 모델의 놀라움 추정치를 인간의 읽기 시간과 더욱 밀접하게 연관시켜 언어 모델의 심리 측정 예측력을 향상시키는 것입니다.
연구진은 언어 모델을 인간 데이터에 정렬하는 문제로 이 문제를 해결합니다. 이를 위해 선형 회귀 분석기의 매개변수를 암시적으로 최적화하여 심리 측정 측정값을 모델링하는 새로운 정렬 기술을 제안합니다. 이 기술은 관찰된 심리 측정 데이터와 예측값 사이의 예상 평균 제곱 오차(MSE)를 최소화하는 보상 함수를 사용합니다. 또한 미세 조정된 모델이 사전 훈련된 참조 모델에서 지나치게 벗어나는 것을 방지하기 위해 KL 발산을 사용하여 목적 함수를 정규화합니다.