本稿では、ビデオ生成における計算コストの課題に取り組み、空間的・時間的なピラミッド表現を用いた効率的なビデオ生成モデリングフレームワーク「ピラミッドフローマッチング」を提案する。
大規模言語モデルを使用した高品質ビデオ生成の可能性を示す。