下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
LLMを用いたコード評価
コードタスクのためのベンチマークの自動生成と信頼性の高いLLMによる評価
本稿では、コード関連タスクの品質、特に「有用性」を評価するための、自動生成されたベンチマークとLLM(Large Language Model)を用いた評価手法を提案する。
1