テキストベースの画像編集(TBIE)は、単一の画像をテキストプロンプトに合わせて変更し、元画像の忠実度を保ちます。既存手法では満足できる結果が得られず、DACは編集可能性と忠実度のバランスを取りながら幅広い編集操作をサポートします。安定拡散モデルを使用して推論フレームワークを構築し、Abduction-1およびAbduction-2でUとΔを最適化します。DACは他手法よりも高いCLIPスコアとLPIPSスコアを示しました。また、120分かかる他手法と比較して15分で1枚の画像を編集することができます。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Xue Song,Jie... pada arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.02981.pdfPertanyaan yang Lebih Dalam