Unduh Linnk AI
•
Asisten Riset
>
Masuk
wawasan
-
安全性を損なう見かけ上無害なデータの特定
安全データに潜む危険 - 見かけ上無害なデータが安全性を損なう可能性
見かけ上無害なデータでも、安全性の高い言語モデルの性能を大幅に低下させる可能性がある。データの表現や勾配の特徴を利用することで、そのようなデータを特定できる。
1