Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
言語モデルの安全性
安全データに潜む危険 - 見かけ上無害なデータが安全性を損なう可能性
見かけ上無害なデータでも、安全性の高い言語モデルの性能を大幅に低下させる可能性がある。データの表現や勾配の特徴を利用することで、そのようなデータを特定できる。
1