Centrala begrepp
언어 모델의 성능 향상은 주로 컴퓨팅 자원의 확장에 의해 이루어졌습니다.
Statistik
Wikitext와 Penn Treebank에서 200개 이상의 언어 모델 평가 데이터셋 사용
8개월마다 성능 임계치 달성에 필요한 컴퓨팅이 절반으로 줄어듦
트랜스포머 아키텍처는 다른 아키텍처에 비해 4.6%의 성능 향상을 제공
Citat
"언어 모델의 성능 향상은 주로 컴퓨팅 자원의 확장에 의해 이루어졌습니다."
"트랜스포머 아키텍처는 언어 모델의 중요한 알고리즘적 발전으로 나타났습니다."