핵심 개념
리눅스 커널 OOM 킬러 구성 요소의 커밋 메시지에는 대부분 근거 정보가 포함되어 있으며, 경험 많은 개발자들은 약 60%의 문장에서 근거를 제공한다.
초록
이 연구는 리눅스 커널 OOM 킬러 구성 요소의 커밋 메시지에 대한 레이블링된 데이터셋을 생성하고 분석하였다.
데이터셋 생성:
- 404개의 비병합 커밋 메시지를 수집하고 전처리하였다.
- 3명의 주석 작성자가 문장 단위로 결정, 근거, 지원 사실 범주로 레이블링하였다.
- 2,234개의 문장이 최종 레이블링되었으며, 주석 작성자 간 신뢰도는 양호한 수준이었다.
데이터셋 분석:
- 98.9%의 커밋에 근거 정보가 포함되어 있으며, 커밋 메시지의 약 60%가 근거 정보로 구성된다.
- 커밋 메시지 크기나 개발자 경험 수준과 근거 정보량 사이에 상관관계가 없다.
- 근거 정보 밀도는 시간이 지남에 따라 일관되게 유지되며, 결정 정보 밀도는 항상 높고 지원 사실 정보 밀도는 낮다.
- 개발자들은 커밋 메시지를 결정 정보-지원 사실 정보-근거 정보 순으로 작성하는 경향이 있다.
통계
대부분의 커밋에는 메모리 할당, 태스크 선택, 노드 등과 관련된 문맥 정보가 포함되어 있다.
개발자들은 미래 영향, 가치 판단, 긍정적 의미의 단어를 사용하여 근거를 제공한다.
인용구
"The 'start' and 'end' arguments to tlb_gather_mmu() are no longer needed"
"Remove the unused arguments and update all callers."