이 연구는 언어 모델(LM)의 성능 향상을 위한 검색 보강(retrieval augmentation)의 효과와 한계를 분석한다.
소프트맥스 병목 현상이 LM과 검색 보강 LM(kNN-LM) 간 성능 차이의 원인이 아님을 실험적으로 확인했다. LM의 마지막 층이 kNN-LM의 분포를 잘 근사할 수 있음을 보였다.
과도 명세(over-specification) 문제를 발견했다. 훈련 데이터에 인과적으로 관련 없는 정보가 포함되어 있어, LM이 이를 일반화하지 못하는 것이다. 이는 GPT-3.5 Turbo에서도 관찰되는 근본적인 한계로, 모델 크기 확장만으로는 해결되지 않는다.
검색 보강이 이 일반화 문제를 부분적으로 해결할 수 있음을 보였다. 또한 중간 표현을 MLP 모델로 매핑하는 방식이 검색 보강과 유사한 성능 향상을 보이면서 저장 공간을 크게 줄일 수 있음을 확인했다.
이 연구는 언어 모델 학습의 근본적인 한계를 규명하고, 이를 해결하기 위한 새로운 접근법을 제시했다는 점에서 의의가 있다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問