Visual Commonsense-aware Representation Network for Video Captioning.

Pengpeng Zeng Haonan Zhang Lianli Gao Xiangpeng Li Jin Qian Heng Tao Shen

Published in: CoRR (2022)

Keyphrases

visual cues
visual properties
visual representation
video data
video streams
multimedia
visual analysis
visual features
visual data
network model
computer networks
video delivery
video sequences
temporal information
network traffic
video surveillance
news video
graphical representation
real time
raw image
network conditions
image retrieval
wireless sensor networks
visual patterns
visual information
complex networks
video analysis
spatial relations
video content