Linnk AI'yı İndirin
•
Araştırma Asistanı
>
Giriş Yap
içgörü
-
大規模言語モデルの「脱獄」攻撃に対する評価
大規模言語モデルの「脱獄」に対する公開ロバスト性ベンチマーク「JailbreakBench」
大規模言語モデルの「脱獄」攻撃を効果的に評価し、攻撃と防御の進捗を追跡するための標準化されたベンチマークを提案する。
1