Linnk AI letöltése
•
Kutatási asszisztens
>
Bejelentkezés
betekintés
-
大規模言語モデルの「脱獄」攻撃に対する評価
大規模言語モデルの「脱獄」に対する公開ロバスト性ベンチマーク「JailbreakBench」
大規模言語モデルの「脱獄」攻撃を効果的に評価し、攻撃と防御の進捗を追跡するための標準化されたベンチマークを提案する。
1