Core Concepts
VVC 기반 비디오 스트리밍에서 비디오 복잡도 특징과 목표 비트레이트를 활용하여 XPSNR을 최대화하는 최적의 인코딩 해상도와 양자화 파라미터를 결정하는 품질 인식 동적 해상도 적응 프레임워크를 제안한다.
Abstract
이 논문은 VVC 기반 비디오 스트리밍 환경에서 지각 품질(XPSNR)을 최대화하는 인코딩 해상도 선택 프레임워크인 QADRA를 제안한다.
비디오 복잡도 특징 추출:
비디오 세그먼트의 공간 및 시간적 복잡도 특징(평균 텍스처 에너지, 평균 기울기, 평균 휘도 등)을 추출한다.
최적 해상도 예측:
비디오 복잡도 특징, 목표 비트레이트, 인코딩/디코딩 시간 제약 조건을 활용하여 XPSNR을 최대화하는 최적 해상도를 예측한다.
XGBoost 기반 모델을 사용하여 XPSNR, 인코딩 시간, 디코딩 시간을 예측한다.
예측된 값을 바탕으로 제약 조건 내에서 최적 해상도를 선택한다.
최적 양자화 파라미터 예측:
비디오 복잡도 특징, 해상도, 목표 비트레이트를 활용하여 목표 비트레이트에 가장 가까운 양자화 파라미터를 예측한다.
JND 기반 표현 제거:
지각적 차이가 JND 임계값 미만인 표현은 제거하여 비트레이트 래더의 중복성을 제거한다.
실험 결과, QADRA는 인코딩 시간 제약 조건 내에서 XPSNR을 최대화하는 최적의 해상도와 양자화 파라미터를 선택하여 비디오 품질을 향상시킬 수 있음을 보여준다. 또한 JND 기반 표현 제거를 통해 비트레이트 래더의 중복성을 제거할 수 있다.
Stats
비디오 세그먼트의 평균 텍스처 에너지(𝐸Y)는 22.40입니다.
비디오 세그먼트의 평균 기울기(ℎ)는 4.70입니다.
비디오 세그먼트의 평균 휘도(𝐿Y)는 129.21입니다.