핵심 개념
CLIP 기반 비디오 학습자가 새로운 도메인에서 효과적으로 일반화될 수 있는지에 대한 연구
초록
CLIP 기반 비디오 학습자의 효과적인 일반화 능력에 대한 연구
XOV-Action 벤치마크를 통한 다양한 도메인 간 평가
씬 편향을 해결하기 위한 새로운 씬-인식 비디오-텍스트 정렬 방법 소개
통계
"모델이 훈련 중인 도메인과 다른 도메인에서의 행동 인식 성능을 평가합니다."
"우리의 방법은 효과적임을 실험적으로 입증합니다."
인용구
"우리의 연구는 씬 편향을 해결하기 위해 새로운 씬-인식 비디오-텍스트 정렬 방법을 제안합니다."
"우리의 방법은 다양한 도메인 간의 도메인 갭을 줄이는 데 효과적입니다."