VATMAN : Video-Audio-Text Multimodal Abstractive Summarization with Trimodal Hierarchical Multi-head Attention.

Published in: ICTC (2023)

Keyphrases