Kernkonzepte
제안하는 CAMSIC 프레임워크는 공간-시차 의존성을 효과적으로 포착하는 강력한 트랜스포머 엔트로피 모델을 중심으로 구축되어, 기존 방식들을 능가하는 압축 성능을 달성합니다.
Zusammenfassung
본 논문은 스테레오 이미지 압축을 위한 CAMSIC 프레임워크를 제안합니다. CAMSIC은 간단한 이미지 인코더-디코더 구조를 사용하여 각 뷰를 독립적으로 변환합니다. 핵심은 공간-시차 의존성을 효과적으로 포착하는 강력한 트랜스포머 엔트로피 모델입니다.
CAMSIC의 주요 특징은 다음과 같습니다:
- 콘텐츠 인식 마스크 이미지 모델링(MIM) 기법을 도입하여 사전 정보와 추정 토큰 간의 양방향 상호작용을 가능하게 합니다. 이를 통해 기존 방식의 한계를 극복하고 압축 성능을 향상시킵니다.
- 제안하는 콘텐츠 인식 MIM 기법을 활용하여 디코더 없는 효율적인 트랜스포머 엔트로피 모델 구조를 설계합니다.
- 실험 결과, CAMSIC은 기존 학습 기반 스테레오 이미지 압축 방식들을 능가하는 압축 성능을 보이며, 빠른 인코딩 및 디코딩 속도를 달성합니다.
Statistiken
제안하는 CAMSIC 방식은 Cityscapes 데이터셋에서 기존 최고 성능 방식 ECSIC 대비 약 8.512% 비트율을 절감합니다.
CAMSIC은 InStereo2K 데이터셋에서 ECSIC 대비 약 0.629% 비트율을 절감합니다.
Zitate
"제안하는 콘텐츠 인식 MIM 기법은 사전 정보와 추정 토큰 간의 양방향 상호작용을 가능하게 하여 압축 성능을 향상시킵니다."
"CAMSIC은 디코더 없는 효율적인 트랜스포머 엔트로피 모델 구조를 설계하여 빠른 인코딩 및 디코딩 속도를 달성합니다."