核心概念
安定拡散モデルにおけるクロスとセルフアテンションの重要性を明らかにする。
要約
本論文では、安定拡散モデルにおけるクロスとセルフアテンションの役割に焦点を当て、画像編集における重要性を探求しています。クロスアテンションは条件付きプロンプトの位置で重みを決定し、セルフアテンションは元画像の構造情報を保持します。これらの分析結果から、新しい画像編集手法が提案され、既存手法よりも優れたパフォーマンスが示されました。
統計
実験結果は平均的な精度であるClip Score(CS)やClip Directional Similarity(CDS)などで評価された。
編集時間はPnPが1枚あたり約335.65秒かかる一方、提案手法は約6.30秒で完了した。
引用
"我々の方法は、元画像の構造情報を最大限保持しつつ目標プロントに従って効果的なオブジェクトや背景の編集を実現します。"
"提案手法は他のTISモデルでも有効であり、さまざまな属性やスタイル、カテゴリーを変更することが可能です。"