핵심 개념
오픈소스 프로젝트에서 유해하고 성차별적인 의사소통이 프로젝트의 성별, 인종, 근속 다양성에 부정적인 영향을 미친다.
초록
이 연구는 오픈소스 소프트웨어(OSS) 프로젝트에서 유해하고 성차별적인 의사소통이 인지 가능한 다양성에 미치는 영향을 조사한다.
먼저, 연구진은 GitHub에서 활성화된 OSS 프로젝트를 선별하고, 2023년 동안의 이슈 및 풀 리퀘스트 댓글을 수집한다. 이 데이터를 이용해 유해 및 성차별적 언어를 자동으로 식별한다.
다음으로, 프로젝트의 성별, 인종, 근속 다양성을 나타내는 Blau 지수를 종속변수로 하고, 유해/성차별 언어 비율, 프로젝트 특성 등을 독립변수로 하는 회귀 모델을 구축한다. 이를 통해 유해/성차별 언어와 다양성 간의 관계를 분석한다.
마지막으로, 시계열 분석을 통해 유해/성차별 언어 비율 변화와 다양성 지수 변화 간의 연관성을 조사한다.
이 연구는 OSS 프로젝트의 다양성 증진을 위해 유해하고 성차별적인 의사소통이 미치는 영향을 실증적으로 보여줄 것으로 기대된다.
통계
프로젝트 나이는 프로젝트 생성 시점부터 마지막 풀 리퀘스트 병합까지의 개월 수이다.
기여자 수는 프로젝트에 참여한 총 기여자 수이다.
이슈 수는 프로젝트에 등록된 총 이슈 수이다.
커밋 수는 프로젝트의 총 커밋 수이다.
빌드 수는 프로젝트의 총 빌드 수이다.
풀 리퀘스트 수는 프로젝트의 총 풀 리퀘스트 수이다.