核心概念
TBIEタスクは、編集可能性と忠実度のトレードオフが主要な課題であり、DACはこの課題に対処するために提案された。
要約
テキストベースの画像編集(TBIE)は、単一の画像をテキストプロンプトに合わせて変更し、元画像の忠実度を保ちます。既存手法では満足できる結果が得られず、DACは編集可能性と忠実度のバランスを取りながら幅広い編集操作をサポートします。安定拡散モデルを使用して推論フレームワークを構築し、Abduction-1およびAbduction-2でUとΔを最適化します。DACは他手法よりも高いCLIPスコアとLPIPSスコアを示しました。また、120分かかる他手法と比較して15分で1枚の画像を編集することができます。
統計
U = arg minU E(t,ϵ)||ϵ - Θ(U,∆=0)(xt, t, P)||2. (式3)
∆ = arg min∆ E(t,ϵ)||ϵ - Θ(U,∆)(xt, t, P ′)||2. (式5)
γ = 1 - η / T^2 (t - T)^2 + η. (式8)
引用
"TBIEタスクは、編集可能性と忠実度のトレードオフが主要な課題であり、DACはこの課題に対処するために提案された。"
"DACは他手法よりも高いCLIPスコアとLPIPSスコアを示しました。"
"DACは他手法よりも高いパフォーマンスを発揮しました。"