Core Concepts
군중 제공 이미지를 활용하여 개인 정보 유출을 최소화하면서도 사진 사실성이 높은 3D 장면 표현을 구축하는 탈중앙화된 접근법을 제안한다.
Abstract
이 논문은 전 세계적으로 분산된 사용자 사진 갤러리의 지리 태그된 이미지를 활용하여 몰입형 3D 보기를 위한 신경 방사 필드(NeRFs)를 탈중앙화된 방식으로 구축하는 프레임워크를 소개한다.
주요 내용은 다음과 같다:
전역 콘텐츠(예: 기념물)와 개인 콘텐츠(예: 사용자 사진)를 분리하는 개인-전역 콘텐츠 분리 기법을 제안한다.
사용자의 전역 NeRF 모델만 서버에 안전하게 집계하는 학습된 연합 기법을 제안한다.
이를 통해 서버 계산 비용을 크게 줄이면서도 사진 사실성이 높은 3D 장면 표현을 구축할 수 있다.
실험 결과, 제안 방식은 기존 중앙집중식 및 탈중앙화된 접근법에 비해 서버 계산 비용은 크게 낮추면서도 사진 사실성이 높은 3D 장면 표현을 구축할 수 있음을 보여준다.
또한 제안 방식은 서버에서 개인 콘텐츠의 재구성을 크게 줄일 수 있음을 분석한다.
Stats
매일 50억 장 이상의 사진이 전 세계적으로 캡처된다.
캡처된 사진 중 2% 미만만이 인터넷에 게시된다.
중앙집중식 방식으로 매일 캡처되는 수십억 개의 장면에 대한 NeRF를 학습하는 것은 계산적으로 불가능하다.
Quotes
"군중 제공 이미지를 활용하여 몰입형 3D 시각적 경험으로 전 세계적으로 변환할 수 있는 잠재력을 보여주는 신경 방사 필드(NeRFs)."
"개인 정보가 포함된 이미지가 대부분 개인 카메라 롤에 고립되어 있다."