Завантажити Linnk AI
•
Помічник з досліджень
>
Увійти
ідея
-
LLMを用いたコード評価
コードタスクのためのベンチマークの自動生成と信頼性の高いLLMによる評価
本稿では、コード関連タスクの品質、特に「有用性」を評価するための、自動生成されたベンチマークとLLM(Large Language Model)を用いた評価手法を提案する。
1