Core Concepts
LOGO 데이터셋은 예술 수영 시나리오에서 프레임 단위의 행동 절차와 구성 정보를 제공하여 그룹 정보를 모델링할 수 있는 다중 사용자 장기 동영상 데이터셋이다. 이를 통해 기존 단일 사용자 단기 동영상 기반 접근법의 한계를 극복하고 복잡한 상황에서의 행동 품질 평가 능력을 향상시킬 수 있다.
Abstract
LOGO 데이터셋은 예술 수영 경기 영상 200개로 구성되어 있으며, 각 영상에는 8명의 선수가 등장한다. 영상의 평균 길이는 204.2초로 기존 데이터셋에 비해 매우 길다. 또한 프레임 단위의 행동 유형 및 시간적 경계, 선수들의 구성 정보 등 풍부한 주석이 제공된다.
이를 바탕으로 저자들은 그룹 정보를 활용하여 장기 동영상의 시간적 맥락을 모델링하는 GOAT 모듈을 제안하였다. GOAT는 공간 정보와 시간 정보를 효과적으로 융합하여 기존 방법론의 성능을 크게 향상시켰다. 실험 결과, LOGO 데이터셋이 기존 데이터셋에 비해 훨씬 더 복잡한 시나리오를 제공하며, GOAT 모듈이 이러한 복잡성을 잘 다룰 수 있음을 보여주었다.
Stats
데이터셋에는 총 200개의 동영상 샘플이 포함되어 있으며, 평균 길이는 204.2초이다.
각 동영상에는 8명의 선수가 등장한다.
총 11시간 20분 41초의 동영상 데이터가 수집되었다.
Quotes
"LOGO 데이터셋은 예술 수영 시나리오에서 프레임 단위의 행동 절차와 구성 정보를 제공하여 그룹 정보를 모델링할 수 있는 다중 사용자 장기 동영상 데이터셋이다."
"GOAT는 공간 정보와 시간 정보를 효과적으로 융합하여 기존 방법론의 성능을 크게 향상시켰다."