이 연구는 선수 식별을 위한 새로운 모델을 제안한다. 기존 모델들은 동영상 속 모션 블러, 낮은 해상도, 가림 현상 등의 문제에 취약했지만, 이 연구에서는 도메인 기반 마스크 자동 인코더(d-MAE)를 활용하여 이러한 문제를 해결하고자 한다.
d-MAE는 기존 MAE와 달리 랜덤 패치에 모션 블러 효과를 적용하는 새로운 마스킹 전략을 사용한다. 이를 통해 모션 블러가 심한 스포츠 영상에서도 강건한 특징을 추출할 수 있다. 또한 키프레임 식별 모듈(KfID)을 개선하여 유니폼 번호가 잘 보이는 프레임을 더 정확하게 추출할 수 있도록 하였다.
실험 결과, 제안 모델은 기존 최신 모델 대비 야구 94.70%, 아이스하키 96.79%, 축구 81.92%의 정확도를 달성하며 우수한 성능을 보였다. 또한 d-MAE와 KfID 모듈의 기여도를 분석한 결과, 각각 1.48%와 1.84%의 성능 향상을 확인할 수 있었다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究