Video Question Answering Using CLIP-Guided Visual-Text Attention.

Shuhong Ye Weikai Kong Chenglin Yao Jianfeng Ren Xudong Jiang

Published in: CoRR (2023)

Keyphrases