본 논문에서는 기존의 폐쇄형 어휘 기반 시청각 이벤트 지역화(AVEL) 작업을 넘어, 학습 과정에서 볼 수 없었던 이벤트 카테고리를 포함하는 테스트 데이터를 처리할 수 있는 새로운 작업인 개방형 어휘 기반 시청각 이벤트 지역화(OV-AVEL) 작업을 제안하고, 이를 위한 데이터셋과 평가 지표, 기준 모델을 제시합니다.