本研究では、コード検索の効率性と有効性を向上させるために、2段階の検索フレームワークTOSSを提案している。
第1段階では、情報検索ベースやバイエンコーダーベースの高速な検索手法を使ってトップKのコード候補を取得する。第2段階では、クロスエンコーダーベースの精度の高い検索手法でこれらの候補を再ランキングする。
実験の結果、第1段階の検索手法を複数組み合わせることで、検索結果の多様性が高まり、全体の検索性能が向上することが分かった。提案手法TOSSは、最先端の検索手法と比べて7.1%高いMRR(Mean Reciprocal Ranking)スコアを達成し、同時に検索時間も大幅に短縮できることが示された。
また、6つの異なるプログラミング言語のデータセットでも、TOSSが最良の性能を発揮することが確認された。
本研究は、コード検索タスクにおける多段階検索手法の探索の出発点となるものである。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Fan Hu,Yanli... alle arxiv.org 03-29-2024
https://arxiv.org/pdf/2208.11274.pdfDomande più approfondite