Core Concepts
교육적인 GitHub 저장소에 숨겨진 위험을 드러내는 연구
Abstract
최근 연구에서 GitHub 저장소에서 악성 소스 코드를 호스팅하는 저장소 집합 식별
ChatGPT의 능력을 활용하여 교육적인 GitHub 저장소를 악의성에 따라 주석 달기
35.2K GitHub 저장소에 대한 체계적인 연구 수행
악의적인 저장소 중 9294개 식별, 14가지 다른 악성 소프트웨어 패밀리 감지
교육적인 저장소의 증가 추세와 악의적인 저장소의 위험성 강조
ChatGPT가 MalEdu 저장소를 85%의 정밀도로 정확하게 감지
ChatGPT 주석에 대한 정규화된 혼동 행렬 표시
ChatGPT가 식별된 MalEdu 저장소의 상위 10개 악성 소프트웨어 패밀리 감지
ChatGPT가 MalEdu 저장소를 85%의 정밀도로 정확하게 감지
식별된 MalEdu 저장소에 대한 깊은 탐구 및 저자 및 콘텐츠 프로파일링 계획
Stats
GitHub는 28M개 이상의 공개 저장소 중 7.5K개가 악성 소스 코드 포함
35.2K 교육적인 GitHub 저장소 중 9294개가 악의적으로 식별됨
Quotes
"GitHub 저장소가 악성 코드 전파를 가능하게 하는가?"
"교육적인 목적으로 게시된 GitHub 저장소가 악성 콘텐츠를 포함할 가능성이 있는지 확인하는 방법은 무엇인가?"
"ChatGPT가 MalEdu 저장소를 85%의 정밀도로 정확하게 감지한다."