이 논문은 관점 왜곡(Perspective Distortion, PD)을 해결하기 위한 방법을 제안한다. PD는 실세계 이미지에 널리 존재하며 컴퓨터 비전 애플리케이션 개발에 어려움을 야기한다. 기존 연구는 주로 PD 보정에 초점을 맞추었지만, 이는 이미지 인식 및 장면 이해와 같은 작업을 두 단계 프로세스로 만들어 비효율적이다.
저자들은 Möbius 변환을 활용하여 PD를 모방하는 MPD(Mitigating Perspective Distortion) 방법을 제안한다. MPD는 카메라 내부 및 외부 매개변수를 추정하지 않고도 PD를 인위적으로 합성할 수 있다. 또한 저자들은 ImageNet-PD라는 새로운 벤치마크 데이터셋을 개발하여 딥러닝 모델의 PD 강건성을 평가한다.
실험 결과, MPD는 기존 벤치마크(ImageNet-E, ImageNet-X)에서 성능을 향상시키고 ImageNet-PD에서 10% 이상의 성능 향상을 보였다. 또한 군중 계수, 어안 이미지 인식, 사람 재식별 등 다양한 PD 영향 실세계 애플리케이션에서도 성능 향상을 보였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Prakash Chan... at arxiv.org 05-07-2024
https://arxiv.org/pdf/2405.02296.pdfDeeper Inquiries