Core Concepts
ChatGPT는 R 프로그래밍 코드 생성에 있어 전반적으로 만족스러운 성능을 보였지만, 간결성 측면에서 개선이 필요한 것으로 나타났다.
Abstract
이 연구는 ChatGPT의 R 프로그래밍 코드 생성 도구로서의 사용성을 평가하였다. 실험 결과:
전반적인 성능: ChatGPT는 정확성, 완결성, 구조화, 논리 명확성, 매개변수 포괄성, 가독성, 설명의 깊이 등 대부분의 품질 기준에서 우수한 점수를 받았다. 다만 간결성 측면에서 상대적으로 낮은 점수를 받았다.
객관적 지표: 평균 시도 횟수는 1.61회, 평균 완료 시간은 47.02초로 나타났다. 98%의 테스트 케이스에서 5회 이내에 만족스러운 결과를 생성하였다.
문제 유형별 성능: ChatGPT는 일반 프로그래밍 문제에서 가장 높은 점수를 받았고, 시각화 문제에서 상대적으로 낮은 점수를 받았다. 이는 객관적 지표에서도 확인되었다.
학습 가능성: 사용자가 ChatGPT를 사용하면서 효과적인 자연어 입력을 학습하기는 어려운 것으로 나타났다.
종합적으로 ChatGPT는 R 프로그래밍 코드 생성에 있어 전반적으로 만족스러운 성능을 보였지만, 간결성 향상과 시각화 문제 해결을 위한 개선이 필요할 것으로 보인다.
Stats
R 프로그래밍 코드 생성 작업을 완료하는 데 평균 47.02초가 소요되었다.
98%의 테스트 케이스에서 5회 이내에 만족스러운 결과를 생성하였다.