WildFusion은 포즈된 이미지나 카메라 분포 학습 없이도 3D-Aware 이미지 합성을 가능하게 하는 새로운 접근법을 제안한다. 이를 위해 3D 구조를 캡처하는 압축된 잠재 표현을 학습하고, 이를 바탕으로 효율적인 잠재 확산 모델을 학습한다.