大規模言語モデル(LLM)は、安全対策を回避するために計算リソースを過負荷にすることで、スケーラブルなジェイルブレイク攻撃に対して脆弱である可能性がある。
大規模言語モデルに対するジェイルブレイク攻撃では、事前の無害な質問を通じて徐々に有害な文脈を構築し、最終的な攻撃クエリを実行することで、安全機構を回避できる。