แนวคิดหลัก
본 논문은 압축 비디오에 내재된 유용한 코딩 사전(motion vector, predictive frame, residual frame)을 활용하여 시간적 및 공간적 정보를 효과적으로 집계하는 코딩 사전 기반 집계 네트워크(CPGA)를 제안한다.
บทคัดย่อ
본 논문은 압축 비디오 화질 향상을 위한 새로운 접근법을 제안한다. 기존 방법들은 압축 비디오에 내재된 유용한 코딩 정보(motion vector, predictive frame, residual frame)를 활용하지 않았지만, 제안하는 CPGA 네트워크는 이러한 코딩 사전을 활용하여 시간적 및 공간적 정보를 효과적으로 집계한다.
CPGA 네트워크는 다음 3개의 핵심 모듈로 구성된다:
- 프레임 간 시간적 집계(ITA) 모듈: 연속 프레임과 코딩 사전(motion vector, predictive frame)을 활용하여 시간적 정보를 집계한다.
- 다중 스케일 비지역 집계(MNA) 모듈: 현재 residual frame을 활용하여 공간적 정보를 집계한다.
- 화질 향상(QE) 모듈: 시간적/공간적으로 집계된 특징을 활용하여 최종 고화질 프레임을 생성한다.
또한 본 논문은 압축 비디오의 코딩 사전을 포함하는 새로운 데이터셋 VCP를 제안한다. 실험 결과, 제안하는 CPGA 네트워크가 기존 최신 방법들보다 우수한 성능을 보인다.
สถิติ
압축 비디오 화질 향상을 위해 다음과 같은 중요 수치가 활용되었다:
제안 모델 CPGA는 기존 최신 방법 STDF-R3L 대비 0.13dB의 PSNR 성능 향상을 달성했다.
CPGA는 STDR 대비 0.03dB의 PSNR 성능 향상을 보였다.
제안 모델의 추론 속도는 STDR 대비 10% 향상되었다.
คำพูด
"압축 비디오에 내재된 코딩 사전(motion vector, predictive frame, residual frame)은 풍부한 시간적 및 공간적 정보를 포함하고 있지만, 기존 방법들은 이를 충분히 활용하지 못했다."
"제안하는 CPGA 네트워크는 코딩 사전을 효과적으로 활용하여 시간적 및 공간적 정보를 집계함으로써 압축 비디오 화질 향상 성능을 크게 개선할 수 있었다."