Download Linnk AI
•
AI-onderzoeksassistent
>
Inloggen
inzicht
-
大規模言語モデルの命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの多言語命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの命令チューニングデータの一部を悪意のある方法で汚染することで、他の言語の出力も悪意のある動作を示すようになる。
1