ControlNet++は、事前学習された識別報酬モデルを使用して、生成された画像と入力条件の一貫性を明示的に最適化することで、制御可能な画像生成を大幅に改善する。
本稿では、画像と条件信号間の相関関係に基づく多様な条件付き画像生成タスクを単一の拡散モデルで統一的に扱うフレームワーク「UniCon」を提案する。
BiGRは、コンパクトなバイナリ潜在コードを用いた新しい条件付き画像生成モデルであり、生成と表現学習の両方の能力を強化することに重点を置いています。