Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
言語モデルの安全性
安全データに潜む危険 - 見かけ上無害なデータが安全性を損なう可能性
見かけ上無害なデータでも、安全性の高い言語モデルの性能を大幅に低下させる可能性がある。データの表現や勾配の特徴を利用することで、そのようなデータを特定できる。
1