Core Concepts
DISN은 단일 뷰 이미지로부터 고품질의 세부적인 3D 메시를 생성할 수 있는 Deep Implicit Surface Network 모델이다. 전역 이미지 특징과 지역 이미지 특징을 결합하여 정확한 부호화된 거리 필드를 예측함으로써 구멍과 얇은 구조와 같은 세부 사항을 일관되게 포착할 수 있다.
Abstract
DISN은 단일 뷰 이미지로부터 고품질의 세부적인 3D 메시를 생성하는 Deep Implicit Surface Network 모델이다.
DISN은 크게 두 부분으로 구성된다. 첫째, 입력 이미지의 카메라 매개변수를 예측한다. 둘째, 예측된 카메라 매개변수를 이용하여 3D 쿼리 포인트를 이미지 평면에 투영하고, 투영된 위치의 지역 이미지 특징과 전역 이미지 특징을 결합하여 해당 3D 포인트의 부호화된 거리 필드(SDF) 값을 예측한다.
지역 이미지 특징 추출 모듈은 DISN의 핵심 혁신 사항이다. 이를 통해 DISN은 구멍, 얇은 구조 등의 세부 사항을 일관되게 포착할 수 있다. 기존 방법들은 전역 이미지 특징만을 사용하여 이러한 세부 사항을 잘 복원하지 못했다.
DISN은 합성 데이터와 실제 이미지 모두에서 다양한 객체 범주에 걸쳐 최첨단 단일 뷰 재구성 성능을 달성한다. 또한 DISN은 다중 뷰 재구성, 형상 보간 등의 응용 분야에도 적용될 수 있다.
Stats
단일 뷰 3D 재구성에서 DISN은 기존 방법들에 비해 더 나은 성능을 보인다.
샤넷 코어 데이터셋의 의자 범주에서 DISN의 EMD는 2.71, CD는 7.55, IoU는 55.3%이다.
이는 기존 방법들인 Binary(EMD 2.75, CD 7.64, IoU 54.8%), Global(EMD 2.71, CD 7.86, IoU 53.6%), One-stream(EMD 2.62, CD 7.55, IoU 53.9%)보다 우수한 성능이다.
Quotes
"DISN은 단일 뷰 이미지로부터 구멍과 얇은 구조와 같은 세부 사항을 일관되게 포착할 수 있는 최초의 딥러닝 모델이다."
"DISN은 다양한 객체 범주에서 최첨단 단일 뷰 3D 재구성 성능을 달성한다."