AttA-NET: Attention Aggregation Network for Audio-Visual Emotion Recognition.

Ruijia Fan Hong Liu Yidi Li Peini Guo Guoquan Wang Ti Wang

Published in: ICASSP (2024)

Keyphrases

audio visual
emotion recognition
multi modal
visual information
speaker verification
visual data
multimedia
multi stream
human computer interaction
data mining
information retrieval
computer vision
context aware