Core Concepts
Arxiv 제출물에서 AI 생성 텍스트의 증가를 정량적으로 분석하고, Originality.AI 도구의 성능을 평가하여 학술 연구의 진실성과 신뢰성을 유지하는 방법을 제시한다.
Abstract
이 연구는 Arxiv에 제출된 논문에서 AI 생성 텍스트의 증가 추세를 정량적으로 분석하고, Originality.AI 도구의 성능을 평가하였다.
연구 배경 및 목적:
ChatGPT 등 AI 생성 텍스트 도구의 발전으로 학술 연구 분야에서 AI 활용이 증가하고 있음
이에 따라 학술 논문의 진실성과 신뢰성 유지가 중요한 과제로 대두됨
이 연구는 Arxiv 제출물에서 AI 생성 텍스트 비율을 분석하고, Originality.AI 도구의 성능을 평가하고자 함
데이터 수집 및 전처리:
Arxiv에서 13,000편의 논문을 수집하여 데이터셋 구축
논문 분야, 게재 시기 등을 고려하여 데이터셋 구성
분석 결과:
Originality.AI 도구를 통해 Arxiv 논문의 AI 생성 텍스트 비율을 분석
2019년 이후 AI 생성 텍스트 비율이 지속적으로 증가하는 추세를 확인
특히 컴퓨터 과학 분야에서 AI 생성 텍스트 비율이 크게 증가한 것으로 나타남
결론 및 시사점:
AI 생성 텍스트의 증가는 학술 연구의 진실성과 신뢰성에 위협이 될 수 있음
Originality.AI 등 AI 탐지 도구의 활용이 중요하며, 이를 통해 학술 연구의 진실성을 유지할 수 있음
향후 AI 생성 텍스트 탐지 기술의 지속적인 발전이 필요할 것으로 보임
Stats
2019년 1월 Arxiv 게재 논문 수: 컴퓨터 과학 3,097편, 물리학 1,947편, 수학 3,081편
2023년 11월 Arxiv 게재 논문 수: 컴퓨터 과학 9,304편(200.42% 증가), 물리학 2,817편(44.68% 증가), 수학 3,760편(22.04% 증가)
Arxiv 논문 중 AI 생성 텍스트 비율: 2019년 3.61% → 2023년 6.22%
Quotes
"AI 생성 텍스트의 증가는 학술 연구의 고유성과 진실성에 영향을 미칠 수 있다."
"Originality.AI와 같은 AI 탐지 도구의 활용이 중요하며, 이를 통해 학술 연구의 진실성을 유지할 수 있다."
"향후 AI 생성 텍스트 탐지 기술의 지속적인 발전이 필요할 것으로 보인다."