CodeEditorBenchは、大規模言語モデルのコード編集能力を包括的に評価するための新しい評価フレームワークである。デバッグ、翻訳、最適化、要件変更などの実世界のコード編集タスクを網羅し、19種類の大規模言語モデルの性能を詳細に分析している。
アラビア語プログラミング言語をPythonコードに変換し、実行するためにLLMを使用する新しい方法を紹介します。
関数型プログラミング言語でのコード補完モデルのパフォーマンスを評価し、高品質なHaskellデータセットの必要性を示す。
C++オブジェクトをスクリプト言語に公開する方法について探求します。
大規模言語モデルを使用してJavaScriptプログラムのセキュリティ脆弱性を見つけて修正する能力を検証する。
ECMAScriptのJavaScript正規表現仕様を忠実に機械化し、安全性と信頼性を確保する。
ループを展開することで、より多くのバグを見つけることができる。
関数型とオブジェクト指向プログラミングの違いを探求し、依存型オブジェクト指向プログラミングを最初の原理から導出する。
C++プログラムにおけるオンヒープオブジェクトの最適化の重要性を強調する。
データ駆動システムのためのPythonプログラム生成ツールの開発と効果的な活用