Keskeiset käsitteet
高解像度画像合成のためのスケーリングされたRectified Flow Transformersに焦点を当て、新しいアーキテクチャとデータ前処理による効果的なトレーニング手法を提案する。
Tiivistelmä
最近の生成モデルフォーミュレーションであるRectified Flowに焦点を当て、大規模な研究により、既存の拡散フォーミュレーションよりも優れたパフォーマンスを実証。新しいtext-to-image生成アーキテクチャが導入され、予測可能なスケーリングトレンドと改善された自動評価および人間評価と関連付けられる低い検証損失が示される。8Bモデルは他のSOTAモデルを上回り、公開ベンチマークで優れた結果を達成。
Tilastot
モデルサイズ:8B
トレーニングステップ数:500k
解像度:2562ピクセル
バッチサイズ:4096
トレーニングデータセット:CoCo(Lin et al., 2014)
Lainaukset
"我々は、大規模な研究により、既存の拡散フォーミュレーションよりも優れたパフォーマンスを実証しています。"
"8Bモデルは他のSOTAモデルを上回り、公開ベンチマークで優れた結果を達成。"
"新しいtext-to-image生成アーキテクチャが導入され、予測可能なスケーリングトレンドと改善された自動評価および人間評価と関連付けられる低い検証損失が示される。"