Cross-Modal and Hierarchical Modeling of Video and Text.

Bowen Zhang Hexiang Hu Fei Sha

Published in: ECCV (13) (2018)

Keyphrases

cross modal
multiple modalities
multi modal
video data
visual data
information retrieval
multimedia
multimedia retrieval
video streams
high level
visual recognition
video content
multimedia data
video analysis
space time
video sequences
semantic information
semantic concepts
multimedia documents
knn
image retrieval
perceptual information