본 논문은 확산 기반 시각적 인지를 위한 암시적 및 명시적 언어 안내 프레임워크를 제안한다. 이 프레임워크는 안정적인 확산 모델의 강력한 특징 표현 능력을 활용하여 시각적 인지 성능을 향상시킨다.