이 연구는 2020년 1월부터 2024년 2월까지 950,965편의 학술 논문을 대상으로 대형 언어 모델(LLM)을 활용한 문구 생성 추세를 분석했다. 주요 결과는 다음과 같다:
컴퓨터 과학 분야 논문에서 LLM 활용이 가장 빠르게 증가하여 2024년 2월 기준 초록의 17.5%, 서론의 15.5%가 LLM 생성 문구인 것으로 추정된다. 반면 수학 분야와 Nature 포트폴리오 저널에서는 가장 낮은 증가율을 보였다.
사전 인쇄물을 더 많이 게시하는 저자의 논문일수록 LLM 활용도가 높은 경향이 있다. 이는 경쟁적이고 빠른 연구 환경에서 저자들이 작문 과정을 가속화하기 위해 LLM을 활용하는 것으로 해석된다.
유사도가 높은 논문들에서 LLM 활용도가 더 높게 나타났다. 이는 LLM 사용이 논문 유사성을 높이거나, 혹은 경쟁이 치열한 연구 분야에서 LLM이 더 많이 활용되는 것으로 볼 수 있다.
페이지 수가 더 적은 논문에서 LLM 활용도가 더 높게 나타났다. 이는 시간 제약으로 인해 저자들이 LLM을 더 많이 활용하는 것으로 해석된다.
이 연구 결과는 학술 출판계에서 LLM 활용이 증가하고 있음을 보여주며, 정확성, 표절, 익명성, 저작권 등의 우려를 해결하기 위한 대책 마련이 필요함을 시사한다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問