Скачать Linnk AI
•
Научный ассистент
>
Войти
аналитика
-
役割演技言語モデルの評価
役割演技言語モデルの評価のための新しいベンチマーク:ユーザーエミュレーションと複数モデル評価
言語モデル自体を使ってユーザーをエミュレーションし、その対話を評価する新しいベンチマークを提案する。
1