オープンソースの大規模言語モデル(LLM)は、独自のLLMと同等以上の品質のコミットメッセージを生成できる可能性があり、プライバシーや持続可能性の懸念を軽減する。
本稿では、検索拡張生成を用いて、コードの変更内容を記述するコミットメッセージの自動生成精度を向上させる手法を提案する。
既存のデータセットには問題があり、CommitBenchは高品質なデータセットを提供することでコミットメッセージ生成の研究を加速させる。