Effiziente Verarbeitung und Analyse von Inhalten zur Gewinnung von Erkenntnissen durch adversariell maskierte Videokonzistenz für unüberwachte Domänenanpassung
Ein transformer-basiertes Modell, das adversariell generierte Masken und konsistente Vorhersagen zwischen maskierten und vollständigen Videos nutzt, um effektive domäneninvariante und klassendiskriminierende Darstellungen zu lernen.