Основные понятия
Diffusionモデルを活用したD-Editフレームワークは、アイテムごとに異なるプロンプトを使用して画像編集を可能にし、高品質かつ多様な編集操作を提供します。
Аннотация
D-Editは、Diffusionモデルを基盤とした画像編集フレームワークであり、複数のアイテムにセグメント化された画像を特定のプロンプトで制御します。このフレームワークは、テキストベース、画像ベース、マスクベースの編集やアイテム削除など、さまざまなタイプの画像編集操作を実現します。D-Editは、定性的および定量的評価を通じて収集された多様な画像に対する編集結果の品質と汎用性を示しています。
Статистика
4種類の編集操作(image-based, text-based, mask-based editing, item removal)がカバーされている。
D-Editは最初のフレームワークであり、「mask-based editing」および「image and text-based editing」が可能。
コードはhttps://github.com/asFeng/d-editで利用可能。
Цитаты
"An Item is Worth a Prompt: Versatile Image Editing with Disentangled Control"
"A key factor contributing to the success of LDM is its robust ability for text-to-image generation."
"We propose D-Edit as a versatile image editing framework for diffusion models."
"D-Edit segments the given image into multiple items, each of which is assigned a prompt to control its representation in the prompt space."
"D-Edit enables users to freely change or establish associations between prompts and items."