Temel Kavramlar
ChatGPT는 연구 논문의 질적 평가에 유용한 도구가 될 수 있지만, 연도, 분야, 초록 길이, 저자 국가 등 다양한 요인에 따른 편향이 존재하며, 이를 인지하고 정규화하는 과정이 필요하다.
Özet
ChatGPT를 이용한 연구 평가: 심층 분석
본 연구 논문은 ChatGPT를 활용한 연구 논문의 질적 평가 시 발생할 수 있는 연도, 국가, 초록 길이, 분야별 편향을 분석하고 그 결과를 제시합니다.
연구 목적
본 연구는 ChatGPT를 이용하여 연구 논문의 질적 평가를 수행할 때 발생할 수 있는 편향을 분석하고, 이러한 편향을 최소화하기 위한 방안을 제시하는 것을 목적으로 합니다.
연구 방법
연구는 Scopus 데이터베이스에서 추출한 26개 분야, 2003년부터 2023년까지 5년 단위로 발간된 117,650개의 논문을 대상으로 진행되었습니다. 각 논문의 제목과 초록을 ChatGPT 4o-mini 모델에 입력하여 질적 평가 점수를 획득하고, 연도, 분야, 초록 길이, 저자 국가별 평균 점수 차이를 분석했습니다. 또한 회귀 분석을 통해 각 변수의 영향력을 비교 분석하고, ChatGPT 점수와 Scopus 인용 횟수 간의 상관관계를 분석했습니다.
주요 연구 결과
- 연도별 편향: ChatGPT는 최근 논문일수록 더 높은 점수를 부여하는 경향을 보였으며, 이는 시간의 흐름에 따라 새로운 연구가 출판되면서 나타나는 자연스러운 현상으로 해석됩니다.
- 분야별 편향: 분야별 평균 ChatGPT 점수는 상당한 차이를 보였으며, 이는 분야별 출판 스타일과 연구 평가 기준의 차이를 반영하는 것으로 판단됩니다.
- 초록 길이: 초록의 길이가 길수록 ChatGPT 점수가 높아지는 경향을 보였지만, 이는 저널의 질적 차이 또는 짧은 논문 형식의 영향일 가능성이 높습니다.
- 저자 국가별 편향: 캐나다 저자의 논문이 모든 분야에서 높은 점수를 받았지만, 영어권 국가가 다른 국가에 비해 뚜렷한 이점을 보이지는 않았습니다.
- 인용 횟수와의 상관관계: ChatGPT 점수는 모든 분야에서 Scopus 인용 횟수와 양의 상관관계를 보였으며, 이는 ChatGPT 점수가 논문의 질적 수준을 어느 정도 반영한다는 것을 시사합니다.
결론 및 제언
본 연구는 ChatGPT를 이용한 연구 평가 시 연도, 분야, 초록 길이, 저자 국가 등 다양한 요인에 따른 편향이 존재함을 밝혔습니다. 따라서 ChatGPT를 연구 평가에 활용할 경우, 이러한 편향을 인지하고 점수를 정규화하는 과정이 필요합니다.
연구의 의의
본 연구는 ChatGPT를 이용한 연구 평가의 가능성과 한계를 명확히 제시하고, 향후 ChatGPT를 이용한 연구 평가 시스템 구축에 필요한 연구 방향을 제시했다는 점에서 의의를 갖습니다.
İstatistikler
본 연구는 26개 분야에서 추출한 117,650개의 논문을 분석에 활용했습니다.
2003년부터 2023년까지 5년 단위로 발간된 논문을 분석에 포함했습니다.
ChatGPT 4o-mini 모델을 사용하여 논문의 질적 평가 점수를 획득했습니다.
연도별 평균 ChatGPT 점수는 꾸준히 증가하는 경향을 보였습니다.
초록 길이와 ChatGPT 점수 간의 상관관계는 분야별로 상이하게 나타났습니다.
ChatGPT 점수는 Scopus 인용 횟수와 양의 상관관계를 보였습니다.
Alıntılar
"Thus, for the most accurate research quality evaluation results from ChatGPT, it is important to normalise ChatGPT scores for field and year and check for anomalies caused by sets of articles with short abstracts."
"This article therefore assesses whether ChatGPT’s average quality scores vary based on the publication years of articles, which ChatGPT is typically not told."
"The results also varied substantially between fields, and first author countries."