Core Concepts
사용자 피드백을 활용하여 AI 기반 코드 추천 시스템의 제안 표시 여부를 최적화하는 방법을 제안한다.
Abstract
이 논문은 AI 기반 코드 추천 시스템인 GitHub Copilot의 사용자 피드백 데이터를 활용하여 어떤 제안을 보여줄지 결정하는 방법을 제안한다.
핵심 내용은 다음과 같다:
제안을 표시할지 여부를 결정하기 위한 효용 이론 기반 프레임워크를 제안한다. 이 프레임워크는 제안이 수락될 가능성과 제안을 생성하는 데 걸리는 지연 시간을 고려한다.
제안 수락 확률을 예측하는 2단계 모델인 CDHF(Conditional Suggestion Display from Human Feedback)를 개발한다. CDHF는 제안을 생성하지 않고도 제안을 표시할지 여부를 결정할 수 있어 지연 시간을 줄일 수 있다.
535명의 프로그래머 데이터를 활용한 사후 평가에서 CDHF가 95%의 정확도로 25%의 제안을 숨길 수 있음을 보여준다. 이를 통해 프로그래머의 생산성을 높일 수 있다.
제안 수락을 보상 신호로 사용하여 제안의 품질을 향상시키는 것이 예기치 않은 문제를 야기할 수 있음을 보여준다.
Stats
프로그래밍 세션 당 평균 97개의 이벤트(제안 표시, 수락, 거절)가 발생했다.
전체 168,807개의 제안 중 33,523개가 수락되어 수락률은 21.4%였다.
Quotes
"GitHub reported a recent randomized study with 95 participants who wrote a web server, where they found that Copilot could potentially reduce task completion time by a factor of two [Kal22]."
"We show that we can hide 25% of suggestions that were shown while guaranteeing that 95% of them would have been rejected."