Interactive Co-Learning with Cross-Modal Transformer for Audio-Visual Emotion Recognition.

Published in: INTERSPEECH (2022)

Keyphrases