Unified Cross-Modal Attention: Robust Audio-Visual Speech Recognition and Beyond.

Published in: IEEE ACM Trans. Audio Speech Lang. Process. (2024)

Keyphrases