Download Linnk AI
•
Forskningsassistent
>
Log på
indsigt
-
大規模言語モデルの命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの多言語命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの命令チューニングデータの一部を悪意のある方法で汚染することで、他の言語の出力も悪意のある動作を示すようになる。
1