Core Concepts
프롬프트 학습을 통해 압축 정보를 암시적으로 인코딩하여 압축 수준에 따른 적응성 있는 블라인드 이미지 복원을 수행합니다.
Abstract
이 논문은 블라인드 압축 이미지 복원(Blind Compressed Image Restoration, CIR) 문제를 다룹니다. 기존 방법들은 압축 품질 요인을 예측하는 네트워크를 사용하여 복원 네트워크를 보조했지만, 예측된 숫자 품질 요인은 공간 정보를 잃어 콘텐츠 인식 적응성이 부족했습니다.
이 논문에서는 프롬프트 학습 기반의 PromptCIR 모델을 제안합니다. PromptCIR은 가벼운 동적 프롬프트를 사용하여 압축 정보를 암시적으로 인코딩하고, 이를 이미지 특징에서 생성된 프롬프트 가중치와 상호 작용시켜 콘텐츠 인식 및 왜곡 인식 적응성을 제공합니다. 또한 RHAG(Residual Hybrid Attention Group) 모듈을 사용하여 국부 및 전역 정보 추출 능력을 향상시켰습니다.
실험 결과, PromptCIR은 NTIRE 2024 블라인드 압축 이미지 향상 트랙에서 1위를 차지했으며, 다양한 벤치마크에서 우수한 성능을 보였습니다. 대규모 데이터셋 사용과 RHAG 모듈 도입이 PromptCIR의 성능 향상에 기여했습니다.
Stats
JPEG 압축 이미지는 8x8 블록으로 분할되고 DCT(Discrete Cosine Transform)를 거친 후 양자화 과정에서 정보가 손실되어 압축 아티팩트가 발생합니다.
압축 아티팩트의 정도는 품질 요인(0~100)에 따라 달라지며, 낮은 값일수록 이미지 품질이 더 나쁩니다.
Quotes
"프롬프트 학습 기반 IR 방법들은 다양한 열화 유형 및 정도에 걸쳐 일반화 능력을 보여주었습니다."
"동적 프롬프트는 공간 정보를 보존하면서 콘텐츠 인식 및 왜곡 인식 표현 능력을 향상시킬 수 있습니다."