본 연구는 실세계 비디오에서 복합적 시공간 추론을 향상시키기 위해 신경-상징적 프레임워크인 NS-VideoQA를 제안한다. NS-VideoQA는 비디오를 상징적 표현으로 변환하고 반복적인 추론을 수행하여 복합적 시공간 추론 능력을 향상시킨다.