Core Concepts
새 관점 의미 분할 문제를 두 단계로 분해하여 해결한다. 첫 번째 단계에서는 자동 인코더를 통해 새 관점 분할 지도의 일반적인 패턴을 학습하고, 두 번째 단계에서는 RGB 입력 이미지를 새 관점 잠재 공간에 정렬한다.
Abstract
이 논문은 새 관점 의미 분할 문제를 두 단계로 분해하여 해결하는 방법을 제안한다.
첫 번째 단계에서는 새 관점 자동 인코더를 사용하여 새 관점 분할 지도의 일반적인 패턴을 학습한다. 이를 위해 새 관점 분할 지도에 50%의 노이즈를 추가하여 모델이 실제 세계의 패턴을 더 잘 학습할 수 있도록 한다. 이를 통해 모델은 합리적이고 현실적인 새 관점 분할 지도를 생성할 수 있게 된다.
두 번째 단계에서는 RGB 입력 이미지를 새 관점 잠재 공간에 정렬한다. 이를 위해 컬럼 단위 트랜스포머를 사용하여 RGB 이미지의 각 컬럼을 새 관점 잠재 공간으로 매핑한다. 이를 통해 새 관점과 RGB 입력 간의 정렬을 달성할 수 있다.
또한 새 관점 분할 지도를 카르테시안 좌표계에서 극좌표계로 변환하여 RGB 이미지와의 공간적 대응을 개선하였다.
실험 결과, 제안 방법은 기존 방법보다 우수한 성능을 보였으며, 특히 원거리 객체 및 작은 객체에 대한 분할 성능이 크게 향상되었다. 또한 다중 스케일 특징 및 카메라 내부 매개변수를 사용하지 않아 계산 오버헤드가 크게 감소하였다.
Stats
새 관점 분할 지도는 카르테시안 좌표계에서 극좌표계로 변환되었다.
RGB 입력 이미지는 900 x 1600에서 396 x 704로 크기가 조정되었다.