本研究は、命令ベース画像編集の課題に取り組んでいる。従来の命令ベース編集手法は、言語で正確に表現できない編集タスクに対応できないという問題がある。そこで本研究では、InstructBrushを提案し、参照画像ペアから編集効果を抽出し、新しい画像の編集に適用する。
具体的には以下の2つの技術を導入している:
さらに、命令逆変換の能力を評価するためのベンチマーク(TOP-Bench)を構築している。定量的・定性的な評価の結果、提案手法は既存手法を大きく上回る性能を示している。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések