命令チューニングされた大規模言語モデルは、ユーザーの指示に基づいて応答を調整できるため、社会的影響力が大きいが、同時に悪意のある方法で操作される可能性もある。本研究では、仮想プロンプト注入(VPI)と呼ばれる新しい種類のバックドア攻撃を提案し、その脅威を実証する。