본 논문에서는 VLM 자체를 공격 도구로 활용하여, 기존의 제약을 넘어서는 다양하고 효과적인 멀티모달 jailbreak 공격을 생성하는 IDEATOR라는 새로운 공격 프레임워크를 제안합니다.
大規模言語視覚モデル (VLM) は、悪意のある画像とテキストのプロンプを生成するために悪用される可能性があり、倫理的なガイドラインや安全対策を迂回して有害なコンテンツを生成させる Jailbreak 攻撃に対して脆弱である。