Dynamische Kreuzaufmerksamkeit für die Audio-Visuell-Dimensionale Emotionserkennung
Die vorgeschlagene dynamische Kreuzaufmerksamkeitsmodell (DCA) kann dynamisch die kreuzaufmerksamen oder unaufmerksamen Merkmale basierend auf starken oder schwachen komplementären Beziehungen zwischen Audio- und Videosignalen auswählen, um die Fusionsleistung auch bei schwachen komplementären Beziehungen zu verbessern.