Effiziente Repräsentationslernung mit dreifacher Entkopplung für multimodale Affektanalyse
Eine neuartige dreifache Entkopplung von Repräsentationen, die modality-invariante, effektiv modality-spezifische und ineffektiv modality-spezifische Repräsentationen aus den Eingabedaten extrahiert, um den Einfluss irrelevanter und widersprüchlicher Informationen über Modalitäten hinweg während des Modelltrainings erheblich zu verringern.