核心概念
ChatGPT-3.5はLeetCodeの易しい問題には高い正解率を示すが、難易度が上がると共にパフォーマンスが低下し、特に複雑な問題や新しいプログラミング言語への対応に課題が残る。しかし、プロンプトエンジニアリングやGPT-4等の進化版モデルの活用により、その精度は改善される。
要約
ChatGPTのコーディング能力評価:論文サマリー
Li, M., & Krishnamachari, B. (2024). Evaluating ChatGPT-3.5 Efficiency in Solving Coding Problems of Different Complexity Levels: An Empirical Analysis. arXiv preprint arXiv:2411.07529v1.
本研究は、大規模言語モデル(LLM)であるChatGPT-3.5を用いて、異なる難易度のコーディング問題を解決する能力を評価することを目的とする。具体的には、難易度(易、中、難)による正解率の変化、プロンプトエンジニアリングによる改善効果、Python以外のプログラミング言語における性能を検証する。