Core Concepts
P2ANet은 전문 테이블 테니스 선수와 심판의 도움을 받아 정밀하게 레이블링된 대규모 테이블 테니스 동작 데이터셋으로, 빠르고 밀집된 동작 탐지를 위한 특별한 벤치마크를 제공한다.
Abstract
P2ANet은 전문 테이블 테니스 선수와 심판의 협업을 통해 구축된 대규모 테이블 테니스 동작 데이터셋이다. 2,721개의 전문 경기 중계 동영상에서 139,075개의 동작 세그먼트를 정밀하게 레이블링하였다. 이 데이터셋은 기존 테이블 테니스 데이터셋에 비해 규모가 크고, 동작의 속도와 밀집도가 매우 높다는 특징이 있다.
데이터셋 구축 과정에서 다음과 같은 주요 단계를 거쳤다:
전문 중계 동영상 수집: 2017-2021년 세계 및 중국 주요 테이블 테니스 대회 중계 동영상 2,721개를 수집하였다.
동작 레이블링: 전문 선수와 심판의 도움을 받아 14개 클래스의 동작을 정밀하게 레이블링하였다. 각 동작의 시작 및 종료 프레임을 정확히 표시하였다.
데이터셋 정제: 카메라 각도, 게임 유형, 오디오 품질 등을 기준으로 데이터셋을 정제하여 최종 버전을 구축하였다.
P2ANet은 기존 스포츠 동작 데이터셋에 비해 다음과 같은 특징이 있다:
규모가 매우 크고(272시간, 2,721개 동영상), 다양한 상위 대회 영상을 포함한다.
동작의 속도가 매우 빠르며(평균 0.5초), 밀집도가 매우 높다(10초당 평균 15개 동작).
두 선수의 동작이 번갈아 나타나는 특성이 있다.
이러한 특징으로 인해 P2ANet은 기존 동작 인식 및 위치 탐지 모델에 큰 도전과제를 제시한다. 본 논문에서는 다양한 최신 모델을 P2ANet에 적용하여 성능을 평가하였다.
Stats
테이블 테니스 경기에서 한 턴당 평균 3~5개의 동작이 나타난다.
10초 동안 평균 15개의 동작이 나타나, 매우 높은 밀집도를 보인다.
대부분의 동작 지속 시간은 0.5초 내외로 매우 짧다.
Quotes
"P2ANet은 전문 테이블 테니스 선수와 심판의 협업을 통해 구축된 대규모 테이블 테니스 동작 데이터셋이다."
"P2ANet은 기존 스포츠 동작 데이터셋에 비해 규모가 크고, 동작의 속도와 밀집도가 매우 높다는 특징이 있다."
"P2ANet은 기존 동작 인식 및 위치 탐지 모델에 큰 도전과제를 제시한다."