이 연구는 2020년 1월부터 2024년 2월까지 950,965편의 학술 논문을 대상으로 대형 언어 모델(LLM)을 활용한 문구 생성 추세를 분석했다. 주요 결과는 다음과 같다:
컴퓨터 과학 분야 논문에서 LLM 활용이 가장 빠르게 증가하여 2024년 2월 기준 초록의 17.5%, 서론의 15.5%가 LLM 생성 문구인 것으로 추정된다. 반면 수학 분야와 Nature 포트폴리오 저널에서는 가장 낮은 증가율을 보였다.
사전 인쇄물을 더 많이 게시하는 저자의 논문일수록 LLM 활용도가 높은 경향이 있다. 이는 경쟁적이고 빠른 연구 환경에서 저자들이 작문 과정을 가속화하기 위해 LLM을 활용하는 것으로 해석된다.
유사도가 높은 논문들에서 LLM 활용도가 더 높게 나타났다. 이는 LLM 사용이 논문 유사성을 높이거나, 혹은 경쟁이 치열한 연구 분야에서 LLM이 더 많이 활용되는 것으로 볼 수 있다.
페이지 수가 더 적은 논문에서 LLM 활용도가 더 높게 나타났다. 이는 시간 제약으로 인해 저자들이 LLM을 더 많이 활용하는 것으로 해석된다.
이 연구 결과는 학술 출판계에서 LLM 활용이 증가하고 있음을 보여주며, 정확성, 표절, 익명성, 저작권 등의 우려를 해결하기 위한 대책 마련이 필요함을 시사한다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Weixin Liang... kl. arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.01268.pdfDybere Forespørgsler