Alapfogalmak
신경망 비디오 코딩에서 조건부 잔여 코딩과 마스크 조건부 잔여 코딩 방식은 기존의 조건부 코딩 방식보다 압축 성능이 우수하며 복잡성이 낮아 효율적인 비디오 압축 기술을 위한 가능성을 제시합니다.
본 논문은 최근 비디오 압축 분야에서 활발히 연구되고 있는 신경망 기반 코덱, 특히 조건부 코딩 방식의 레이트-왜곡-복잡성 트레이드 오프에 대한 연구 결과를 다룹니다. 기존 조건부 코딩 방식의 정보 병목 현상을 개선하기 위해 제안된 조건부 잔여 코딩과 마스크 조건부 잔여 코딩 방식을 DCVC 코덱에 적용하여 성능을 비교 분석합니다.
본 논문에서는 DCVC 코덱을 기반으로 조건부 코딩, 조건부 잔여 코딩, 마스크 조건부 잔여 코딩 방식을 구현하고 Vimeo-90k 데이터셋을 사용하여 모델을 학습했습니다. 각 코딩 방식의 정보 병목 현상 정도를 조절하기 위해 컨디션 신호의 채널 크기(C)를 조정하며 실험을 진행했습니다. UVG, HEVC Class B, C, E, HEVC-RGB, MCL-JCV 데이터셋을 사용하여 PSNR-RGB 기반 BD-rate를 측정하여 압축 성능을 평가했습니다. 또한, 인코딩/디코딩 MACs, 모델 크기, 컨디션 신호의 채널 크기를 분석하여 각 코딩 방식의 복잡성을 비교했습니다.