Conceptos Básicos
본 논문에서는 축구 경기장의 구조적 특징과 딥러닝 기술을 활용하여 카메라 보정의 정확도를 향상시키는 새로운 다단계 파이프라인을 제안합니다.
Resumen
축구 카메라 보정 향상에 대한 연구 논문 요약
참고문헌: Falaleev, N. S., & Chen, R. (2024). Enhancing Soccer Camera Calibration Through Keypoint Exploitation. In Proceedings of the 7th ACM International Workshop on Multimedia Content Analysis in Sports (MMSports '24), October 28-November 1, 2024, Melbourne, VIC, Australia. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/3689061.3689074
본 연구는 축구 중계 영상에서 카메라 보정의 정확도를 높이기 위해, 경기장의 구조적 특징을 활용하여 충분한 수의 고품질 포인트 쌍을 찾는 데 어려움을 해결하고자 한다.
1. 주요 특징점 탐지
경기장의 라인, 원, 교차점 등 구조적 특징에서 추출한 57개의 랜드마크 키포인트 정의
라인-라인 교차점: 주석에서 제공된 라인 포인트에 적용된 선형 데이터 피팅의 교차점 30개
라인-원뿔형 교차점: 원뿔형(주석에서 '원 중앙', '원 왼쪽', '원 오른쪽')과 라인 사이의 교차점 6개
원뿔형 접선: 알려진 외부 지점에서 타원까지 접선의 접점 8개
추가 구조적 포인트: 상기 하위 집합의 포인트로 생성된 호모그래피를 사용하여 피치 중앙 및 페널티 스폿을 포함한 피치 종축을 따라 9개의 포인트와 중앙 원의 1/4 회전을 표시하는 4개의 포인트 추가
좌우 모호성 해결: 카메라 정렬이 피치 장축 방향과 일치하는 경우 시간적 맥락 없이 좌우를 정확하게 구분하기 어려운 문제 해결을 위해 카메라에 가장 가까운 골 에어리어를 항상 왼쪽으로 간주하도록 포인트를 다시 매핑
2. 라인 탐지
이미지 내에서 키포인트가 부족할 경우 카메라 보정을 위해 충분한 포인트를 확보하기 위해 라인 탐지 모델 구현
주석의 정렬되지 않은 포인트를 처리하기 위해 라인 피팅 알고리즘을 적용하여 유효한 끝점을 얻고, 라인 피팅 알고리즘에 실패한 포인트는 학습에서 제외
히트맵 기반 모델 적용: 네트워크의 헤드는 23개 채널의 히트맵 레이어이며, 각 채널은 라인에 해당, 기존 라인을 나타내는 채널의 경우 두 개의 히트 포인트 생성
3. 카메라 보정
OpenCV 4.7의 calibrateCamera 메서드에서 구현된 기본 카메라 보정 알고리즘 사용
표준 핀홀 카메라 모델 활용: 비점수차 및 왜곡을 0으로 가정하고 주요 지점을 프레임 중앙에 고정
기존의 체커보드 보정 패턴 대신 키포인트와 실제 피치 패턴 치수 사용
골대 다각형을 포함하는 두 개의 추가 수직 평면을 고려하여 기본 보정 접근 방식 개선 (OpenCV Multiplane)
예측된 키포인트의 하위 집합에서 카메라 보정 프로세스 반복: 모든 키포인트, 라인-라인 교차점 키포인트만, RANSAC 필터링을 사용하여 잠재적 이상값을 필터링한 후 지표면 키포인트, 지표면의 모든 포인트
반복 투표자 알고리즘 구현: 세 가지 임계값 수준 이상의 예측 신뢰도를 가진 포인트를 사용하여 위에서 설명한 투표자 프로세스를 반복하고 가장 높은 신뢰도를 가진 포인트에서 얻은 카메라 매개변수 집합 선택
라인 예측 모델 결과 융합: 이미지 내에서 사용 가능한 예측 키포인트 수가 부족할 경우 이미지 경계를 벗어난 예측 라인 교차점도 고려