Core Concepts
公開コードレビューにおける開発者の要求品質を向上させるため、要求の必要性予測とタグ推薦の2つのサブタスクを統一的に学習するフレームワークを提案する。
Abstract
本研究は、公開コードレビュー(PCR)プロセスにおける要求品質保証に焦点を当てている。PCRプロセスでは、開発者が必要な要求を提出し、コミュニティの実践者がその必要性を評価する。また、開発者は適切なレビュアーにマッチさせるためのタグを選択する必要がある。
従来の研究では、これらのサブタスクを個別に扱っていたが、本研究では、これらを統一的に学習するフレームワークであるUniPCRを提案する。UniPCRは以下の2つの手法を用いる:
テキストプロンプトチューニング:
2つのサブタスクをマスクド言語モデル(MLM)に変換する
ハードプロンプトを使ってプロンプトテンプレートを構築する
コードプレフィックスチューニング:
コード表現の学習を最適化するためにソフトプロンプトを使用する
コードの構造的な意味情報をグラフベースのデータフローで表現する
実験結果は、UniPCRがサブタスクの精度を向上させ、従来手法を上回ることを示している。これにより、開発者の視点から見た公開コードレビューの有効性が強調された。
Stats
要求の必要性が高い場合、26,632件
要求の必要性が低い場合、35,056件
1件あたりの平均タグ数は2.89~2.95