핵심 개념
ML 시스템에서 ML 코드 냄새의 출현, 제거, 생존 기간을 이해하는 것이 핵심 목표이다.
초록
이 연구는 ML 시스템에서 ML 코드 냄새의 출현, 제거, 생존 기간을 탐구하는 것을 목표로 한다.
먼저 RQ0에서는 ML 코드 냄새의 전반적인 유병률을 파악한다. 이를 통해 ML 코드 냄새 문제의 중요성을 확인할 수 있다.
RQ1에서는 ML 코드 냄새가 언제 도입되는지 분석한다. 파일 생성 시 도입되는지, 프로젝트 진화 과정에서 도입되는지 등을 확인한다.
RQ2에서는 ML 코드 냄새가 도입될 때 수행된 작업이 무엇인지 분석한다. 버그 수정, 기능 추가, 리팩토링 등 어떤 활동이 ML 코드 냄새 도입과 관련되는지 파악한다.
RQ3에서는 ML 코드 냄새가 제거되는 시점과 방법을 분석한다. ML 코드 냄새가 어떤 시점에 제거되며, 어떤 리팩토링 작업을 통해 제거되는지 확인한다.
RQ4에서는 ML 코드 냄새의 생존 기간을 분석한다. 각 유형의 ML 코드 냄새가 얼마나 오래 지속되는지 파악한다.
이 연구를 통해 ML 시스템의 품질 관리를 위한 실용적인 통찰력을 얻을 수 있을 것으로 기대된다.
통계
ML 시스템에서 ML 코드 냄새가 가장 많이 발견되는 파이프라인 단계는 데이터 준비 단계이다.
대규모 프로젝트에서 ML 코드 냄새의 유병률이 중소 규모 프로젝트에 비해 더 높다.
ML 코드 냄새는 프로젝트 초기 단계에 주로 도입되며, 릴리스 직전 단계에서도 많이 발견된다.
인용구
"ML 시스템은 기술 부채와 코드 냄새에 매우 취약하다."
"ML 개발자들이 사용할 수 있는 품질 관리 도구와 실행 방법이 부족하다."
"ML 코드 냄새의 출현과 제거 과정에 대한 이해가 부족하다."