Основные понятия
정부 지원 소프트웨어 도구의 가시성과 접근성을 높이고 임상 정보학 커뮤니티의 협력을 촉진하기 위해 학술 문헌에서 관련 GitHub 리포지토리를 자동으로 추출하고 분석하는 방법론을 제시한다.
Аннотация
이 연구는 임상 정보학 분야의 학술 논문에서 GitHub 리포지토리 URL을 자동으로 추출하고 이를 분석하는 방법론을 소개한다.
- arXiv API를 활용하여 임상 정보학 관련 논문을 검색하고 초록에서 GitHub URL을 추출한다.
- 추출된 URL을 정제하고 GitHub API를 통해 리포지토리 정보(별, 포크, 오픈 이슈, 기여자 수 등)를 수집한다.
- 리포지토리의 성숙도를 별, 포크, 오픈 이슈, 기여자 수 등의 지표를 기반으로 평가한다.
- 오류 처리와 API 요율 제한 기능을 통해 안정적이고 효율적인 스크립트 실행을 보장한다.
이를 통해 NIH 등 정부 지원 소프트웨어 도구의 가시성과 활용도를 높이고, 임상 정보학 커뮤니티의 협력과 혁신을 촉진할 수 있다. 또한 향후 대규모 언어 모델(LLM)을 활용하여 리포지토리에 대한 요약과 평가를 자동으로 생성함으로써 지식베이스의 유용성을 더욱 높일 수 있다.
Статистика
정부 지원 소프트웨어 도구의 가시성과 접근성 향상이 필요하다.
1000개의 임상 정보학 논문에서 33개의 고유한 GitHub 리포지토리가 식별되었다.
일부 리포지토리는 GitHub 검색 도구에 색인되지 않았다.
Цитаты
"정부 지원 연구의 투자 수익을 극대화하기 위해 NIH 자금으로 개발된 소프트웨어 도구의 가시성과 접근성을 높이는 것이 이 연구의 첫 번째 동기이다."
"이 연구는 임상 정보학 분야의 오픈소스 소프트웨어 개발과 공유의 다양하고 역동적인 특성을 조명한다."