이 논문은 자기 지도 학습 기반 비디오 객체 분할 문제를 다룹니다. 기존의 비디오 데이터 기반 접근법과 달리, 제안하는 HVC(Hybrid Visual Correspondence) 방법은 정적 이미지만을 사용하여 효율적으로 모델을 학습합니다.
HVC는 정적 이미지에서 의사 동적 신호를 추출하여 정적-동적 시각적 대응을 학습합니다. 구체적으로:
이를 통해 HVC는 기존 비디오 데이터 기반 접근법 대비 훨씬 적은 데이터와 시간으로도 우수한 성능을 달성합니다. 또한 다양한 비디오 레이블 전파 작업에서도 강력한 성능을 보입니다.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Gensheng Pei... às arxiv.org 04-23-2024
https://arxiv.org/pdf/2404.13505.pdfPerguntas Mais Profundas