本研究では、GPT-3.5をデータサイエンティストとして活用し、ゼロショットの自然言語クエリに対する回答生成の精度を評価した。
まず、15種類のベンチマークデータセットを作成し、各データセットに対する15種類の質問を手動で作成した。次に、3段階のワークフローを構築した。
この3段階のワークフローを通じて、GPT-3.5を活用してデータ分析を自動化することを試みた。
評価の結果、全225問中74問(32.89%)の正解率を達成した。データセットのサイズによる大きな差はなく、小規模、中規模、大規模データセットでそれぞれ33.33%、29.33%、36%の正解率を示した。
一方で、GPTモデルが誤ったコードを生成したり、トークン数の制限により十分なコンテキストを提供できないといった課題も明らかになった。
今後の展望として、より高性能なGPTモデルの活用や、refleXionなどの手法を取り入れることで、さらなる精度向上が期待できる。また、より大規模なデータセットに対する評価を行うことで、大規模言語モデルのデータ分析への適用可能性をさらに検討していく必要がある。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Manit Mishra... lúc arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00188.pdfYêu cầu sâu hơn