下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
役割演技言語モデルの評価
役割演技言語モデルの評価のための新しいベンチマーク:ユーザーエミュレーションと複数モデル評価
言語モデル自体を使ってユーザーをエミュレーションし、その対話を評価する新しいベンチマークを提案する。
1