Download Linnk AI
•
Forskningsassistent
>
Log på
indsigt
-
役割演技言語モデルの評価
役割演技言語モデルの評価のための新しいベンチマーク:ユーザーエミュレーションと複数モデル評価
言語モデル自体を使ってユーザーをエミュレーションし、その対話を評価する新しいベンチマークを提案する。
1