Concepts de base
ChatGPTはR言語プログラムコードの生成に高い有用性を示すが、難しい課題では失敗する可能性がある。ユーザーの体験は良好で、平均試行回数は1.61回、平均完了時間は47.02秒である。最も弱い側面は簡潔性で、5点満点中3.80点である。
Résumé
本論文は、ChatGPTのR言語コード生成ツールとしての使用性を評価する。
まず、テストデータセットを構築した。このデータセットには、難易度レベルと問題タイプのメタデータが含まれている。次に、ユーザーが実際にChatGPTを使用するのと同様の方法で、テストを行った。つまり、複数回の試行を許可し、生成されたコードの品質を様々な観点から評価した。
実験の結果、以下のことが明らかになった:
全体的な使用性は良好で、正確性、完全性、構造性、論理性、パラメータカバレッジ、読みやすさ、説明の深さの各指標で高得点を得た。
最も弱い側面は簡潔性で、5点満点中3.80点だった。
平均試行回数は1.61回、平均完了時間は47.02秒と、ユーザー体験は良好であった。
難易度の高い問題では失敗する可能性があるが、全体としてChatGPTはR言語コード生成に高い有用性を示した。
ユーザーがChatGPTの使用方法を学習するのは難しいことが示された。
Stats
R言語プログラムコードを生成するタスクの完了に要した平均試行回数は1.61回である。
タスクの平均完了時間は47.02秒である。