核心概念
이 논문에서는 제한된 대역폭 환경에서 고품질 인간 중심 비디오 통신을 가능하게 하는 혁신적인 다중 입도 시간적 궤적 인수분해(MTTF) 프레임워크를 제안하여 생성적 인간 비디오 압축의 새로운 지평을 열었습니다.
要約
다중 입도 시간적 궤적 인수분해를 사용한 생성적 인간 비디오 압축
본 논문에서는 대역폭 제약이 있는 환경에서 인간 중심 비디오 통신의 효율성을 향상시키기 위해 다중 입도 시간적 궤적 인수분해(MTTF) 프레임워크를 활용한 혁신적인 생성적 인간 비디오 압축 방법을 제안합니다.
제안된 MTTF 프레임워크는 고차원 시각 신호를 압축적 표현을 위한 간결한 모션 벡터로 암묵적으로 특성화하고, 모션 표현성을 위해 이러한 벡터를 세분화된 필드로 변환하는 모션 인수분해 전략을 기반으로 합니다. 이를 통해 최소한의 표현 비용으로 충분한 시각적 모션 정보를 담은 비트스트림을 생성합니다. 또한, 향상된 배경 안정성을 갖춘 해상도 확장 가능 생성 모듈을 개발하여 프레임워크를 더 높은 재구성 안정성과 유연한 해상도 적응을 향해 최적화합니다.