핵심 개념
로컬 인과주의 메커니즘을 통해 이전 캡션, 프레임 및 현재 캡션 간의 인과 관계를 고려하여 시각 이야기를 더 잘 생성하는 모델을 제안합니다.
통계
Causal-Story는 PororoSV 및 FlintstonesSV 데이터셋에서 최신 FID 점수를 달성했습니다.
모델의 훈련 및 추론 속도가 이전 방법과 비교하여 향상되었습니다.
인용구
"로컬 인과주의 메커니즘을 통해 이전 캡션, 프레임 및 현재 캡션 간의 인과 관계를 고려하여 시각 이야기를 더 잘 생성하는 모델을 제안합니다."
"Causal-Story는 로컬 인과주의 메커니즘을 도입하여 이전 캡션, 프레임 및 현재 캡션 간의 인과 관계를 고려하여 현재 프레임을 생성하고 이야기 생성의 전반적 일관성을 향상시킵니다."