本研究では、CLIP モデルの脆弱性を明らかにし、「CLIPマスタープリント」と呼ばれる画像を発見した。これらの画像は、CLIP モデルにとって多数の異なるプロンプトに対して高い確信度スコアを最大化することができるが、人間にとっては無関係または認識不能に見える。
具体的には以下の3つのアプローチを用いて「CLIPマスタープリント」を生成した:
これらの手法により生成された画像は、CLIP モデルにとって多数のプロンプトに対して高いスコアを得ることができ、実際の画像よりも優先的に選択されてしまう可能性がある。
さらに、生成された「CLIPマスタープリント」は、対象としたプロンプト以外の関連するプロンプトに対しても高いスコアを得る傾向があることが分かった。これは、CLIP モデルの脆弱性をさらに深刻化させる。
本研究では、CLIP モデルの脆弱性を軽減する2つの対策を提案した:
これらの対策は、CLIP ベースのシステムの安全性を高めるための重要な取り組みである。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Matt... lúc arxiv.org 04-15-2024
https://arxiv.org/pdf/2307.03798.pdfYêu cầu sâu hơn