Cascade transformers with dynamic attention for video question answering.

Yimin Jiang Tingfei Yan Mingze Yao Huibing Wang Wenzhe Liu

Published in: Comput. Vis. Image Underst. (2024)

Keyphrases

question answering
syntactic information
named entities
natural language processing
question classification
information retrieval
qa clef
natural language
video sequences
passage retrieval
relation extraction
question answering systems
cross language
sentence retrieval
natural language questions
video frames
open domain question answering
semantic roles
candidate answers
information extraction
artificial intelligence
dependency parsing
probabilistic model
expert systems
multimedia
speech transcripts