MTCAM: A Novel Weakly-Supervised Audio-Visual Saliency Prediction Model With Multi-Modal Transformer.

Published in: IEEE Trans. Emerg. Top. Comput. Intell. (2024)

Keyphrases