核心概念
Causal-Storyは、過去のキャプション、フレーム、および現在のキャプション間の因果関係を考慮したローカル因果注意メカニズムを組み込んでおり、物語生成のグローバルな一貫性を向上させています。
摘要
Causal-Storyは、物語生成における因果関係を重視し、従来の手法よりも優れたFIDスコアを達成しています。モデルはPororoSVとFlintstonesSVデータセットで評価され、視覚的なストーリーテリングに改善が見られました。また、AR-LDMと比較してトレーニング速度と推論速度が向上しました。
統計資料
Causal-StoryはPororoSVとFlintstonesSVデータセットで最新のFIDスコアを獲得しました。
AR-LDMに比べてトレーニング時間が短縮されました。
引述
"物語生成において前フレームや前キャプションと現在のフレーム生成との因果関係を学習することができます。"
"Causal-Storyは文脈的な因果関係を理解し、不要なキャプションに影響されません。"