Core Concepts
픽셀 인식 크로스 어텐션 모듈과 조정 가능한 노이즈 스케줄을 도입하여 사실적이고 지각적으로 우수한 이미지 초해상도 및 개인화된 스타일화를 달성하였다.
Abstract
본 논문은 사실적 이미지 초해상도(Real-ISR)와 개인화된 스타일화를 위한 픽셀 인식 안정 확산(PASD) 모델을 제안한다.
픽셀 인식 크로스 어텐션 모듈: 이를 통해 확산 모델이 픽셀 단위의 이미지 구조를 인식할 수 있게 하여, 기존 방식들의 구조 불일치 문제를 해결하였다.
조정 가능한 노이즈 스케줄: 이를 통해 지각-충실도 간 균형을 조절할 수 있어, 사실적이고 지각적으로 우수한 결과를 얻을 수 있다.
열화 제거 모듈: 이를 통해 실제 저화질 이미지의 열화 요소를 제거하여, 확산 모듈이 이미지 세부 복원에 집중할 수 있게 하였다.
고수준 정보 활용: 이미지 분류, 객체 탐지, 캡션 등의 고수준 정보를 활용하여 초해상도 성능을 향상시켰다.
개인화된 스타일화: 기반 모델을 개인화된 모델로 교체하여, 다양한 스타일의 이미지를 생성할 수 있다.
실험 결과, PASD는 사실적 이미지 초해상도와 개인화된 스타일화 분야에서 우수한 성능을 보였다.
Stats
저화질 입력 이미지와 고화질 정답 이미지 간 PSNR은 약 26dB 수준이다.
저화질 입력 이미지와 고화질 정답 이미지 간 SSIM은 약 0.78 수준이다.
저화질 입력 이미지와 고화질 정답 이미지 간 LPIPS는 약 0.28 수준이다.
Quotes
"픽셀 인식 크로스 어텐션 모듈을 통해 확산 모델이 픽셀 단위의 이미지 구조를 인식할 수 있게 하였다."
"조정 가능한 노이즈 스케줄을 통해 지각-충실도 간 균형을 조절할 수 있어, 사실적이고 지각적으로 우수한 결과를 얻을 수 있다."
"열화 제거 모듈을 통해 실제 저화질 이미지의 열화 요소를 제거하여, 확산 모듈이 이미지 세부 복원에 집중할 수 있게 하였다."