المفاهيم الأساسية
제안하는 IBVC 기법은 보간 기반 프레임 복원과 아티팩트 감소 코덱을 통해 기존 방식 대비 계산 복잡도를 크게 낮추면서도 우수한 압축 성능을 달성한다.
الملخص
본 논문은 학습 기반 B-프레임 비디오 압축 기법인 IBVC(Interpolation-driven B-frame Video Compression)를 제안한다. 기존 방식들은 양방향 광학 흐름 추정 또는 비디오 프레임 보간을 활용하여 B-프레임을 복원하지만, 양방향 움직임 추정 및 보상 과정에서 양자화 왜곡이 발생하여 압축 효율이 낮다는 문제가 있었다.
IBVC는 이러한 문제를 해결하기 위해 다음과 같은 핵심 기술을 제안한다:
- 보간 기반 움직임 추정 및 보상: 기존 방식과 달리 IBVC는 추가적인 비트레이트 없이 보간을 통해 움직임 정보를 복원한다. 이를 통해 양자화 왜곡을 방지하고 계산 복잡도를 크게 낮출 수 있다.
- 잔차 기반 마스킹 인코더: 보간된 프레임과 원본 프레임의 잔차 정보를 활용하여 의미 있는 영역을 선별적으로 압축함으로써 중복 코딩을 줄인다.
- 조건부 시공간 디코더: 과거 프레임의 정보를 활용하여 보간 오류와 아티팩트를 효과적으로 제거한다.
실험 결과, IBVC는 기존 학습 기반 B-프레임 압축 기법 대비 우수한 압축 성능과 계산 복잡도 측면에서 큰 개선을 보였다. 또한 H.266/VVC의 RA 구성과 비교해서도 더 나은 성능을 달성하였다.
الإحصائيات
제안하는 IBVC 기법은 기존 방식 대비 평균 27.51%의 BD-rate 감소를 달성했다.
IBVC의 모델 파라미터는 11.6M으로 기존 방식 대비 크게 감소했다.
IBVC의 코딩 시간은 832ms로 기존 방식과 유사한 수준이다.
اقتباسات
"IBVC는 보간 기반 움직임 추정 및 보상을 통해 양자화 왜곡을 방지하고 계산 복잡도를 크게 낮출 수 있다."
"IBVC의 잔차 기반 마스킹 인코더는 의미 있는 영역을 선별적으로 압축함으로써 중복 코딩을 줄일 수 있다."
"IBVC의 조건부 시공간 디코더는 과거 프레임의 정보를 활용하여 보간 오류와 아티팩트를 효과적으로 제거할 수 있다."