축소 비트 중간값 양자화(RBMQ)는 기존 압축 기술과 결합하여 파일 크기를 크게 줄이면서도 눈에 띄는 품질 저하 없이 이미지를 압축할 수 있는 중간 과정 기술이다.
확산 모델과 에지 추정 네트워크를 결합하여 이미지 압축 성능을 향상시킴
계층적 ROI(Hierarchical-ROI)와 적응형 양자화를 통해 인간 얼굴과 텍스트의 화질을 유지하면서도 매우 낮은 비트레이트에서 우수한 시각적 품질을 달성할 수 있다.
본 논문은 다중 스케일 및 방향성 주파수 성분을 효과적으로 포착하는 주파수 인식 트랜스포머 블록을 제안하여, 기존 학습 기반 이미지 압축 모델의 성능을 크게 향상시킨다.
초저 비트레이트에서도 사실적인 이미지 재구성을 가능하게 하는 확산 모델 기반의 이미지 압축 기술을 제안한다.
기존 학습 기반 이미지 압축 방식은 상관관계가 높은 특징을 학습하여 압축 성능이 제한적이었다. 본 연구에서는 채널 간 특징 장식 해제 기법을 제안하여 기존 압축 모델의 성능을 향상시켰다.
본 논문은 학습 기반 이미지 압축 솔루션의 지각적 최적화를 위해 새로운 손실 함수와 주관적 테스트 방법론을 제안한다. 제안된 방법론을 통해 저비트율에서 이미지 품질을 향상시킬 수 있으며, 고비트율에서는 이점이 없음을 실험 결과를 통해 확인하였다.
EGIC는 의미론적 분할 정보를 활용하여 효율적으로 이미지를 압축하고 복원할 수 있는 생성적 압축 모델이다. 이를 통해 기존 방식에 비해 우수한 압축 성능과 지각적 품질을 달성할 수 있다.
제안하는 CAMSIC 프레임워크는 공간-시차 의존성을 효과적으로 포착하는 강력한 트랜스포머 엔트로피 모델을 중심으로 구축되어, 기존 방식들을 능가하는 압축 성능을 달성합니다.
학습 기반 이미지 압축에서 변환은 통신 시스템의 변조 기술을 통해 해석될 수 있으며, 이를 통해 기존 변환 기법을 일반화하고 새로운 변환 기법을 제안할 수 있다.