Core Concepts
언어 모델 연구는 사회적 영향에 대한 관심이 증가하고 있으며, 자연어 처리 분야 외 다양한 분야로 확장되고 있다. 산업계와 학계의 역할 변화와 국가 간 협력 부족이 관찰되고 있다.
Abstract
이 연구는 2018년 1월 1일부터 2023년 9월 7일까지 arXiv에 게재된 16,979개의 언어 모델 관련 논문을 분석하여 최근 동향을 파악하였다.
주요 결과는 다음과 같다:
언어 모델 연구의 주제 변화:
사회적 영향에 대한 관심이 크게 증가하여 Computers and Society 분야의 논문 비율이 20배 증가했다.
응용 및 사회적 영향 관련 주제가 빠르게 성장한 반면, BERT 및 임베딩 관련 주제는 감소하고 있다.
새로운 저자들이 절반 가량을 차지하며, 이들은 컴퓨터 비전, 소프트웨어 공학, 보안 등 다양한 분야에서 유입되고 있다.
산업계와 학계의 역할 변화:
전체적으로 학계 논문 비율이 증가했으나, 구글, 마이크로소프트 등 주요 기업의 논문 비율은 감소했다.
산업계 논문은 효율성, 성능 등 방법론 관련 주제에 집중되는 반면, 학계 논문은 사회적 영향, 응용 등 다양한 주제를 다룬다.
기관 간 협력 양상:
미국과 중국 기관 간 협력은 매우 제한적이며, 대부분의 협력은 동일 국가 내에서 이루어진다.
산업-학계 협력이 많지만, 주로 산업계가 관심 있는 주제에 집중된다.
이러한 분석 결과는 언어 모델 연구 분야의 변화와 발전 방향에 대한 시사점을 제공한다.
Stats
2023년에는 Computers and Society 분야의 언어 모델 논문 비율이 이전 대비 20배 증가했다.
2023년 언어 모델 논문의 절반 가량(49.5%)은 이전에 자연어 처리 논문을 발표한 적이 없는 저자들이 작성했다.
2023년 구글, 마이크로소프트, 아마존, 메타 등 주요 기업의 언어 모델 논문 비율은 이전 대비 13.0%로 감소했다.
Quotes
"언어 모델 연구는 사회적 영향에 대한 관심이 크게 증가하고 있으며, 자연어 처리 분야 외 다양한 분야로 확장되고 있다."
"주요 기업의 언어 모델 논문 비율이 감소하고 있는데, 이는 개방성 감소의 broader한 현상을 반영한다."
"미국과 중국 기관 간 협력은 매우 제한적이며, 대부분의 협력은 동일 국가 내에서 이루어진다."