Core Concepts
LLMは現実世界での開発者支援に向けた改善が必要。
Abstract
LLM(Large Language Models)はコード生成において優れた性能を示す。
ChatGPTを使用したコード生成は高レベルな概念のデモンストレーションやドキュメント内の例示に限定されることが多い。
開発者とChatGPT間の会話を分析し、実際のソフトウェア開発でのLLM活用を評価する。
RQ1:ChatGPTを用いたコード生成時の開発者との対話構造を理解する。
RQ2:ChatGPTによって生成されたコードが開発者をどれだけ支援しているかを調査する。
DevGPTデータセットから抽出した結果、Commitカテゴリでは平均2.4ラウンドで会話が終了し、Code Fileカテゴリでは平均10.4ラウンドかかることが明らかになった。
Stats
ChatGPT Sharing URLsからDevGPTデータセットを形成。
DevGPTデータセットには17,913プロンプトと11,751コードスニペットが含まれる。
コミット関連の会話は平均2.4ラウンドで終了。