MAiVAR-T: Multimodal Audio-image and Video Action Recognizer using Transformers.

Muhammad Bilal Shaikh Douglas Chai Syed Mohammed Shamsul Islam Naveed Akhtar

Published in: EUVIP (2023)