Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
LLMを用いたコード評価
コードタスクのためのベンチマークの自動生成と信頼性の高いLLMによる評価
本稿では、コード関連タスクの品質、特に「有用性」を評価するための、自動生成されたベンチマークとLLM(Large Language Model)を用いた評価手法を提案する。
1