Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
大規模言語モデルの命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの多言語命令チューニングにおける裏口攻撃の横断言語的な移転可能性
大規模言語モデルの命令チューニングデータの一部を悪意のある方法で汚染することで、他の言語の出力も悪意のある動作を示すようになる。
1