ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
言語モデルの安全性
安全データに潜む危険 - 見かけ上無害なデータが安全性を損なう可能性
見かけ上無害なデータでも、安全性の高い言語モデルの性能を大幅に低下させる可能性がある。データの表現や勾配の特徴を利用することで、そのようなデータを特定できる。
1