텍스트 기반 이미지 생성 모델의 확장성을 높이기 위해 모델 간 특징 융합 기법을 제안하였다. 이를 통해 개별 모델을 활용하여 다양한 조건을 결합하는 zero-shot 멀티모달 이미지 생성이 가능해졌다.