본 논문에서는 인간과 기계 모두를 위한 효율적인 비디오 표현 및 압축을 가능하게 하는 새로운 비디오 코딩 패러다임을 제시합니다. 이를 위해 베이스 레이어에서 객체 감지를 지원하고, 인핸스먼트 레이어에서 베이스 레이어 정보를 활용하여 인간 시청을 위한 입력 복원을 지원하는 종단 간 학습 가능한 확장형 비디오 코덱을 소개합니다.
본 논문에서는 고주파 정보를 활용하여 디테일 손실을 최소화하고 압축 성능을 향상시킨, 향상된 하이브리드 신경망 기반 비디오 압축 방법을 제안합니다.
본 논문에서는 협업 지능 환경에서 감시 비디오 데이터의 효율적인 전송을 위해 인터 프레임 특징 맵 차분 코딩(IFMDC) 기법을 제안하고, 이를 통해 기존 HEVC 코덱보다 우수한 압축 성능과 객체 감지 정확도를 달성할 수 있음을 실험적으로 검증했습니다.
본 논문에서는 학습된 B-프레임 코딩에서 발생하는 도메인 변화 문제를 해결하기 위해, 저해상도에서 모션 추정을 수행할지 여부를 예측하는 경량 분류기를 사용하는 Fast-OMRA라는 새로운 접근 방식을 제안합니다.
본 논문에서는 학습 기반 비디오 코덱, 특히 SSF 코덱이 서로 다른 플랫폼에서 발생하는 부동 소수점 반올림 오류로 인해 실제 적용에 어려움을 겪고 있음을 보여주고, 하이퍼 프라이어 디코딩 경로에 정적 양자화를 적용하여 이 문제를 효과적으로 해결하는 방법을 제시합니다.
DMVC는 딥러닝 정확도를 향상시키기 위해 인간의 시각적 인식을 우선시하는 기존의 압축 방법과 달리, 데이터 크기를 효율적으로 줄이면서 딥러닝 정확도에 중요한 의미 정보를 보존하는 데 중점을 둔 혁신적인 비디오 압축 프레임워크입니다.
본 논문에서는 학습된 웨이블릿 비디오 코덱에 가변 레이트 지원, 시간적 계층 적응형 품질 스케일링 및 다단계 학습 전략을 도입하여 기존 방법보다 코딩 효율성을 높이고 최첨단 성능을 달성했습니다.
본 논문에서는 여러 프레임에 걸쳐 나타나는 비 국소적 상관관계를 활용하여 시간적 prior를 강화함으로써 학습 기반 비디오 압축(LVC)의 성능을 향상시키는 새로운 비디오 압축 방식인 ECVC를 제안합니다.
이 논문에서는 제한된 대역폭 환경에서 고품질 인간 중심 비디오 통신을 가능하게 하는 혁신적인 다중 입도 시간적 궤적 인수분해(MTTF) 프레임워크를 제안하여 생성적 인간 비디오 압축의 새로운 지평을 열었습니다.
신경망 비디오 코딩에서 조건부 잔여 코딩과 마스크 조건부 잔여 코딩 방식은 기존의 조건부 코딩 방식보다 압축 성능이 우수하며 복잡성이 낮아 효율적인 비디오 압축 기술을 위한 가능성을 제시합니다.