본 연구 논문에서는 인간과 기계 모두의 요구를 충족하는 새로운 비디오 코딩 패러다임을 제시합니다. 기존의 비디오 코딩 기술은 인간 시청에 최적화되어 있었지만, 최근 딥러닝 기반 머신 비전 기술의 발전으로 인해 기계 분석에 적합한 비디오 코딩 기술의 필요성이 대두되었습니다. 예를 들어 자동 교통 모니터링 시스템에서는 차량 감지, 추적 및 계산과 같은 분석 작업이 지속적으로 실행되어야 하지만, 잠재적인 사고를 검토하기 위한 인간의 시청은 간헐적으로만 필요할 수 있습니다. 이러한 요구 사항을 충족하기 위해 본 논문에서는 베이스 레이어에서 머신 비전 작업을 지원하고 인핸스먼트 레이어에서 인간 시청을 위한 입력 복원을 지원하는 새로운 확장형 비디오 코덱을 제안합니다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Hadi... klokken arxiv.org 11-19-2024
https://arxiv.org/pdf/2307.08978.pdfDypere Spørsmål