事前学習済みのディフュージョンモデルを活用し、追加のトレーニングなしで高解像度の画像を生成する手法「アップサンプルガイダンス」を提案する。
低解像度画像から高解像度画像を効率的に生成するため、確率流サンプリングを用いた条件付き拡散モデルを提案する。また、ハイブリッド・パラメータ化と画質損失関数を導入することで、生成画像の一貫性と品質を向上させる。
HiDiffusion は、事前学習済みの拡散モデルを活用して、高解像度の画像を効率的に生成することができる。オブジェクトの重複を解消し、高品質な画像を生成できる。
MegaFusionは、既存のディフューション・モデルを活用して、追加のチューニングなしで高解像度かつ様々なアスペクト比の画像を効率的に生成することができる。
事前学習済み潜在拡散モデル (LDM) を高解像度画像生成に適応させる、訓練不要な新しいフレームワーク、AP-LDM (Attentive and Progressive LDM) を提案する。
SANAは、最大4096×4096解像度の高品質な画像を高速に生成できる、効率性に優れた新しいテキスト画像生成フレームワークです。
FreCaSは、潜在拡散モデルの粗から精への生成プロセスを活用し、高解像度画像を段階的に生成することで、従来の手法よりも高速かつ高品質な画像生成を実現する。
事前学習済み拡散モデルと新規フレームワークPixelsmithを用いることで、ギガピクセル級の超高解像度画像を単一のGPUで生成することが可能になる。