Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
役割演技言語モデルの評価
役割演技言語モデルの評価のための新しいベンチマーク:ユーザーエミュレーションと複数モデル評価
言語モデル自体を使ってユーザーをエミュレーションし、その対話を評価する新しいベンチマークを提案する。
1