본 논문은 동적 객체를 포함하는 4D 장면에 대한 제로 샷 스타일 전송 문제를 다룹니다. 기존의 3D 스타일 전송 기법은 정적 장면에 대해서만 효과적이었지만, 동적 객체가 포함된 4D 장면에는 적용하기 어려웠습니다.
제안하는 StyleDyRF 프레임워크는 다음과 같은 핵심 구성요소로 이루어집니다:
정규화된 특징 볼륨(Canonical Feature Volume, CFV): 동적 장면의 4D 시간 특징 볼륨을 모델링하기 위해, 정규화된 3D 특징 볼륨과 변형 네트워크를 사용합니다. 이를 통해 시간에 따른 일관성을 유지할 수 있습니다.
정규화된 스타일 변환(Canonical Style Transformation, CST): 특징 볼륨과 스타일 이미지로부터 데이터 기반으로 선형 스타일 변환 행렬을 학습합니다. 이를 통해 시간에 따른 일관성 있는 스타일 변환을 수행할 수 있습니다.
실험 결과, 제안하는 StyleDyRF 모델은 기존 방법들에 비해 우수한 성능을 보이며, 동적 장면에 대한 제로 샷 4D 스타일 전송을 효과적으로 수행할 수 있음을 보여줍니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문