Scarica Linnk AI
•
Assistente di Ricerca
>
Accedi
approfondimento
-
LLMを用いたコード評価
コードタスクのためのベンチマークの自動生成と信頼性の高いLLMによる評価
本稿では、コード関連タスクの品質、特に「有用性」を評価するための、自動生成されたベンチマークとLLM(Large Language Model)を用いた評価手法を提案する。
1