核心概念
언어 모델의 성능 향상은 주로 컴퓨팅 자원의 확장에 의해 이루어졌습니다.
統計資料
Wikitext와 Penn Treebank에서 200개 이상의 언어 모델 평가 데이터셋 사용
8개월마다 성능 임계치 달성에 필요한 컴퓨팅이 절반으로 줄어듦
트랜스포머 아키텍처는 다른 아키텍처에 비해 4.6%의 성능 향상을 제공
引述
"언어 모델의 성능 향상은 주로 컴퓨팅 자원의 확장에 의해 이루어졌습니다."
"트랜스포머 아키텍처는 언어 모델의 중요한 알고리즘적 발전으로 나타났습니다."