核心概念
초저 비트레이트에서도 사실적인 이미지 재구성을 가능하게 하는 확산 모델 기반의 이미지 압축 기술을 제안한다.
摘要
이 논문은 초저 비트레이트에서도 사실적인 이미지 재구성을 가능하게 하는 새로운 이미지 압축 기술인 PerCo를 제안한다.
- 기존 이미지 압축 기술은 비트레이트와 왜곡 간의 균형을 맞추는 데 초점을 맞추었지만, 낮은 비트레이트에서 압축 아티팩트가 발생하는 문제가 있었다.
- PerCo는 사전 학습된 확산 모델을 디코더로 사용하여 이러한 문제를 해결한다.
- 이미지의 국소적 특징과 전역적 의미 정보를 모두 활용하여 초저 비트레이트에서도 사실적인 이미지 재구성을 달성한다.
- 실험 결과, PerCo는 기존 방식에 비해 FID와 KID 지표에서 큰 성능 향상을 보였으며, 비트레이트에 따른 성능 저하도 크지 않았다.
- 또한 의미 기반 지표인 CLIP 점수와 mIoU에서도 전반적으로 개선된 성능을 보였다.
統計資料
512x768 Kodak 이미지를 153바이트로 압축할 수 있다.
0.003 비트/픽셀의 초저 비트레이트에서도 사실적인 이미지 재구성이 가능하다.
引述
"전통적인 이미지 및 비디오 코덱은 비율-왜곡 함수(rate-distortion function)를 최적화하지만, 이는 '사실성'의 비용을 초래한다."
"우리는 사전 학습된 텍스트-이미지 확산 모델을 활용하여 완벽한 사실성 코덱을 향한 진전을 이루었다."