核心概念
본 논문에서는 학습된 웨이블릿 비디오 코덱에 가변 레이트 지원, 시간적 계층 적응형 품질 스케일링 및 다단계 학습 전략을 도입하여 기존 방법보다 코딩 효율성을 높이고 최첨단 성능을 달성했습니다.
摘要
학습된 웨이블릿 비디오 코덱의 성능 향상
본 연구 논문에서는 시간적 계층 적응성을 갖춘 가변 레이트 학습 웨이블릿 비디오 코딩 방법을 제안합니다. 저자들은 기존 학습 웨이블릿 비디오 코덱의 한계점을 지적하며, 이를 개선하기 위해 세 가지 새로운 기술을 소개합니다.
기존 모델의 한계점
- 고정된 레이트-왜곡 포인트: 기존 모델은 각 레이트-왜곡 포인트에 대해 별도의 모델 학습이 필요하여 학습 및 저장 비용이 증가합니다.
- 제한적인 시간적 계층 학습: 기존 모델은 두 프레임에 대한 학습만 지원하여 실제 추론 시 여러 시간적 계층으로 구성된 GOP (Group of Pictures)와의 불일치를 초래합니다.
- 시간적 계층별 품질 적응 부족: 기존 모델은 단일 시간적 계층에 대한 학습만 지원하여 B 프레임 코딩에서 상당한 코딩 이득을 제공하는 계층별 품질 적응을 허용하지 않습니다.
제안된 모델: pMCTF-L
저자들은 위의 한계점을 해결하기 위해 다음과 같은 세 가지 새로운 기술을 pMCTF-L 모델에 도입했습니다.
- 가변 레이트 지원: 학습 가능한 품질 스케일링 매개변수를 사용하여 부드러운 레이트 조정을 가능하게 합니다.
- 시간적 계층 적응형 품질 스케일링: 더 높은 코딩 효율성을 위해 MCTF의 계층 구조를 고려한 시간적 계층 적응형 품질 스케일링을 도입합니다.
- 다단계 학습 전략: 여러 계층에서 학습할 수 있는 다단계 학습 전략을 제안합니다. 이를 통해 가능한 학습 시퀀스 길이를 두 배로 늘리고 MCTF의 학습-테스트 불일치를 줄입니다.
실험 결과
저자들은 제안된 방법을 평가하기 위해 UVG 및 UVG 4K 데이터 세트를 사용하여 광범위한 실험을 수행했습니다. 그 결과, 제안된 pMCTF-CA-L 모델은 기존 MCTF 모델보다 BD 레이트 (Bjøntegaard Delta bitrate)에서 최소 -17%의 성능 향상을 보였으며, DCVC-DC와 같은 최첨단 학습 코덱보다 우수한 성능을 달성했습니다. 특히 높은 비트 전송률에서 pMCTF-CA-L 모델은 다른 학습 기반 코덱보다 우수한 성능을 보였습니다.
결론
본 논문에서는 학습된 MCTF 코덱이 학습 중에 두 개의 시간적 계층을 고려할 수 있도록 하는 학습 전략을 소개했습니다. 이를 통해 학습-테스트 차이를 줄이고 유연한 레이트 지원과 함께 시간적 계층 적응형 품질 스케일링을 가능하게 했습니다. 전반적으로 제안된 코덱인 pMCTF-CA-L은 pMCTF-CA에 비해 최소 -17%의 BD 레이트 감소를 달성했으며 DCVC-DC와 같은 최첨단 학습 코덱보다 성능이 뛰어났습니다.
统计
pMCTF-CA-L 모델은 pMCTF-CA에 비해 BD 레이트에서 최소 -17%의 성능 향상을 보였습니다.
pMCTF-CA-L 모델은 UVG 데이터 세트에서 약 0.11bpp 이상의 비트 전송률에서 VTM보다 우수한 성능을 보였습니다.
pMCTF-CA-L 모델은 UVG 4K 데이터 세트에서 DCVC-HEM 및 DCVC-DC보다 우수한 성능을 보였습니다.
pMCTF-CA-L 모델은 UVG 데이터 세트에서 DCVC-DC보다 PSNR 측면에서 약 17.49%의 BD 레이트 감소를 달성했습니다.
pMCTF-CA-L 모델은 UVG 4K 데이터 세트에서 DCVC-DC보다 약 10% 더 우수한 성능을 보였습니다.