テキストベースの画像編集(TBIE)は、単一の画像をテキストプロンプトに合わせて変更し、元画像の忠実度を保ちます。既存手法では満足できる結果が得られず、DACは編集可能性と忠実度のバランスを取りながら幅広い編集操作をサポートします。安定拡散モデルを使用して推論フレームワークを構築し、Abduction-1およびAbduction-2でUとΔを最適化します。DACは他手法よりも高いCLIPスコアとLPIPSスコアを示しました。また、120分かかる他手法と比較して15分で1枚の画像を編集することができます。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Xue Song,Jie... alle arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.02981.pdfDomande più approfondite