이 논문은 비디오 활동 예측 문제에서 데이터 불확실성 문제를 해결하기 위한 방법을 제안한다. 데이터 불확실성은 비디오 내용 진화 과정과 활동 레이블 간 동적 상관관계에서 발생한다. 이는 모델의 일반화 능력과 비디오 내용에 대한 깊이 있는 이해를 저하시켜 심각한 오류 누적과 성능 저하를 초래한다.
제안 방법은 불확실성 값을 생성하여 예측 결과의 신뢰성을 나타낸다. 이 불확실성 값은 softmax 함수의 온도 매개변수로 사용되어 예측 활동 분포의 평활도를 조절한다. 또한 활동 진화에 대한 시간적 클래스 상관관계와 의미적 관계를 반영한 활동 레이블 표현을 구축하여 분포 조정을 보장한다.
불확실성은 샘플 간 및 시간 길이 간 상대적 방식으로 정량화되어, 전체 데이터셋에 대한 절대적 불확실성 값 추정보다 더 접근 가능한 방식으로 모델링된다.
실험 결과, 제안 방법은 다양한 백본 모델과 벤치마크에서 향상된 정확도와 강건성/해석 가능성을 보여준다. 특히 불확실성이 높은 샘플과 장기 꼬리 활동 범주를 처리할 때 효과적이다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Zhaobo Qi,Sh... kl. arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.18648.pdfDybere Forespørgsler