Скачать Linnk AI
•
Научный ассистент
>
Войти
аналитика
-
大規模言語モデルの命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの多言語命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの命令チューニングデータの一部を悪意のある方法で汚染することで、他の言語の出力も悪意のある動作を示すようになる。
1