본 논문은 학습 기반 이미지 압축(LIC) 모델의 성능 향상을 위해 주파수 인식 트랜스포머(FAT) 블록을 제안한다. FAT 블록은 다음과 같은 핵심 구성 요소를 포함한다:
실험 결과, 제안 모델은 기존 최신 LIC 모델 및 표준 코덱 대비 우수한 압축 성능을 보였다. Kodak, Tecnick, CLIC 데이터셋에서 각각 VTM-12.1 대비 14.5%, 15.1%, 13.0%의 BD-rate 향상을 달성했다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Han Li,Shaoh... lúc arxiv.org 03-20-2024
https://arxiv.org/pdf/2310.16387.pdfYêu cầu sâu hơn