DisEnvisioner 是一種新穎的方法,旨在解決可定制化圖像生成中的關鍵問題。現有方法,無論是基於調整的還是無需調整的,都難以準確解釋視覺提示中的主體關鍵屬性。這導致了主體無關屬性滲入生成過程,最終損害了個性化質量,包括可編輯性和ID一致性。
DisEnvisioner 由兩個關鍵組件組成:DisVisioner 和 EnVisioner。DisVisioner 將圖像特徵有效地分離為主體關鍵特徵和無關特徵,從而過濾掉無關信息,使模型只關注主體的關鍵屬性,促進更準確的可編輯性。EnVisioner 進一步豐富了分離的主體關鍵特徵,顯著提高了ID一致性和整體定制化質量。
實驗結果表明,DisEnvisioner 在遵循指令、維持ID一致性和推理速度方面優於現有方法,展現了其卓越的個性化能力和效率。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Jing He, Hao... : arxiv.org 10-04-2024
https://arxiv.org/pdf/2410.02067.pdfDaha Derin Sorular