下载 Linnk AI
•
研究助手
>
登录
洞察
-
役割演技言語モデルの評価
役割演技言語モデルの評価のための新しいベンチマーク:ユーザーエミュレーションと複数モデル評価
言語モデル自体を使ってユーザーをエミュレーションし、その対話を評価する新しいベンチマークを提案する。
1