Core Concepts
코드 검색 성능과 효율성을 높이기 위해 기존 방법들을 통합한 두 단계 코드 검색 프레임워크를 제안한다.
Abstract
이 논문은 코드 검색을 위한 두 단계 프레임워크 TOSS를 제안한다.
첫 번째 단계에서는 정보 검색 기반 및 bi-encoder 모델을 사용하여 상위 K개의 코드 후보를 효율적으로 회수한다. 두 번째 단계에서는 cross-encoder 모델을 사용하여 이 후보들을 정밀하게 재순위화한다.
실험 결과, TOSS는 기존 방법들의 장점을 결합하여 검색 성능과 효율성을 모두 향상시킬 수 있다. 특히 다중 채널 회수 방식을 통해 회수 다양성을 높임으로써 전체 성능을 더욱 개선할 수 있었다. TOSS는 CodeSearchNet 벤치마크에서 최신 기술 대비 7.1% 향상된 MRR 성능을 달성했다.
Stats
코드 검색 성능(MRR)이 0.763으로 최신 기술 대비 7.1% 향상되었다.
검색 시간은 기존 최고 모델 대비 1/1400로 크게 단축되었다.
Quotes
"TOSS는 기존 방법들의 장점을 결합하여 검색 성능과 효율성을 모두 향상시킬 수 있다."
"다중 채널 회수 방식을 통해 회수 다양성을 높임으로써 전체 성능을 더욱 개선할 수 있었다."