下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
言語モデルの安全性
安全データに潜む危険 - 見かけ上無害なデータが安全性を損なう可能性
見かけ上無害なデータでも、安全性の高い言語モデルの性能を大幅に低下させる可能性がある。データの表現や勾配の特徴を利用することで、そのようなデータを特定できる。
1