ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
大規模言語モデルの「脱獄」攻撃に対する評価
大規模言語モデルの「脱獄」に対する公開ロバスト性ベンチマーク「JailbreakBench」
大規模言語モデルの「脱獄」攻撃を効果的に評価し、攻撃と防御の進捗を追跡するための標準化されたベンチマークを提案する。
1