核心概念
本稿では、拡散モデルにおける従来のUNetアーキテクチャをDiffusion Transformer (DiT)に置き換え、フローマッチングを採用した、トレーニングフリーの画像編集手法Stable Flowを提案する。本手法は、DiT内の「重要レイヤー」と呼ばれる、画像形成に不可欠なレイヤーを自動的に特定し、これらのレイヤーにソース画像の注意特徴を選択的に注入することで、安定した画像編集を実現する。
要約
Stable Flow: トレーニングフリー画像編集のための重要なレイヤー
Avrahami, O., Patashnik, O., Fried, O., Nemchinov, E., Aberman, K., Lischinski, D., & Cohen-Or, D. (2024). Stable Flow: Vital Layers for Training-Free Image Editing. arXiv preprint arXiv:2411.14430.
本研究は、テキストプロンプトに基づいて画像を編集する際、ソース画像の編集されていない領域を忠実に保持しながら、プロンプトで指定された変更を反映した画像を生成することを目的とする。