Alapfogalmak
HiCo 模型通過分層建模佈局實現空間解耦,從而更好地控制圖像生成過程中對象的位置和語義,尤其在處理複雜佈局方面表現出色。
標題: HiCo: Hierarchical Controllable Diffusion Model for Layout-to-image Generation
作者: Bo Cheng, Yuhang Ma, Liebucha Wu, Shanyuan Liu, Ao Ma, Xiaoyu Wu, Dawei Leng, Yuhui Yin
機構: 360 AI Research
會議: 38th Conference on Neural Information Processing Systems (NeurIPS 2024)
現有的文本到圖像生成模型在處理複雜佈局時仍面臨挑戰,例如對象缺失、光照不一致、視角衝突等問題。本研究旨在解決這些問題,並提高佈局到圖像生成的控制性和圖像質量。