下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
大規模言語モデルの命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの多言語命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの命令チューニングデータの一部を悪意のある方法で汚染することで、他の言語の出力も悪意のある動作を示すようになる。
1