Multi-Granularity Relational Attention Network for Audio-Visual Question Answering.

Published in: IEEE Trans. Circuits Syst. Video Technol. (2024)

Keyphrases