단일 이미지에서 반사 정보를 활용하여 자기 지도 학습 기반으로 수면 깊이를 추정할 수 있다.
단일 이미지에서 깊이 추정은 고유한 모호성(예: 스케일)을 가지고 있으며, 텍스트 설명 또한 공간적 배치의 모호성을 가지고 있다. 이 연구는 두 가지 모호성을 보완하여 메트릭 스케일의 깊이 추정을 달성한다.
현대 생성 이미지 모델에 저장된 풍부한 시각적 지식을 활용하여 단일 이미지 깊이 추정 성능을 향상시킬 수 있다.
단일 이미지 깊이 추정을 위해 사전 학습된 ViT 모델의 임베딩을 활용하여 확산 모델을 조건화하는 새로운 접근법을 제안한다.
인간 언어에 내재된 객체의 깊이 분포에 대한 편향을 추출하고, 이를 단일 이미지 깊이 추정 모델에 활용하여 성능 향상을 달성할 수 있다.
DepthFM은 단일 이미지에서 빠르고 정확한 깊이 추정을 달성하는 Flow Matching 기반의 모델입니다. 합성 데이터만으로 학습되었음에도 불구하고 실제 이미지에 대해 우수한 제너럴라이제이션 성능을 보입니다.
DepthFM은 단일 이미지에서 효율적이고 정확한 깊이 추정을 달성하는 Flow Matching 기반의 모델입니다. 이 모델은 합성 데이터만으로 학습되었음에도 불구하고 실제 이미지에 대해 우수한 제로샷 일반화 성능을 보입니다.
DepthFM은 단일 이미지에서 빠르고 정확한 깊이 추정을 달성하는 Flow Matching 기반의 모델입니다. 합성 데이터만으로 학습하면서도 실제 이미지에 대해 우수한 제너럴라이제이션 성능을 보입니다.
EC-Depth는 표준 및 어려운 시나리오에서 정확하고 일관된 깊이 추정을 달성하기 위한 새로운 자기 지도 학습 프레임워크이다.