Core Concepts
소프트웨어 공학 연구자들은 GitHub를 통해 연구 산출물(도구, 복제 패키지, 데이터셋)을 공유하고 있으며, 이는 연구 영향력과 밀접한 관련이 있다.
Abstract
이 연구는 소프트웨어 공학 분야의 상위 학술지에 게재된 약 1만 편의 논문에서 발견된 3,449개의 GitHub 링크를 분석하였다. 주요 발견사항은 다음과 같다:
논문 저자들은 GitHub를 다양한 목적으로 활용하고 있는데, 주로 연구 도구, 복제 패키지, 데이터셋 공유를 위해 사용한다.
GitHub 활용은 2014년 이후 급격히 증가했으며, 최근 논문의 약 14%가 GitHub 저장소를 포함하고 있다.
저장소 인기도와 논문 인용 횟수 간에 상관관계가 있으며, 특히 인기 있는 저장소를 가진 논문일수록 더 많이 인용되는 경향이 있다.
저장소 관리 측면에서는 저자의 응답성이 낮은 편이다. 많은 저장소에서 제기된 이슈들이 장기간 방치되고 있으며, 이는 연구 산출물의 지속적인 발전을 저해할 수 있다.
이 연구 결과는 연구 산출물의 지속적인 관리와 문서화의 중요성, 그리고 이에 대한 학계의 인센티브 구조 개선 필요성을 시사한다.
Stats
연구자들이 공개한 GitHub 저장소 중 약 76.3%가 연구 도구 관련 저장소이다.
연구 도구 관련 저장소의 평균 별 개수는 53.5개, 중간값은 6개이다.
복제 패키지 관련 저장소의 평균 별 개수는 1.11개, 중간값은 1개에 불과하다.
Quotes
"GitHub는 개발자들 사이의 소셜 코딩 기회를 제공하는 오픈소스 플랫폼으로, 소프트웨어 공학 연구자들도 이를 활용하여 연구 산출물을 공유하고 있다."
"연구 저장소의 인기도와 논문 인용 횟수 간에 상관관계가 있으며, 특히 인기 있는 저장소를 가진 논문일수록 더 많이 인용되는 경향이 있다."