VidTr: Video Transformer Without Convolutions.

Yanyi Zhang Xinyu Li Chunhui Liu Bing Shuai Yi Zhu Biagio Brattoli Hao Chen Ivan Marsic Joseph Tighe

Published in: ICCV (2021)

Keyphrases

video content
video data
multimedia
video sequences
video analysis
video streams
video frames
multimedia data
video retrieval
real time
fuzzy logic
compressed video
video shots
video clips
video processing
spatial and temporal
space time
video images
digital video
high voltage
video segmentation
video database
dynamic scenes
video surveillance
key frames
event detection
multiscale
signal processing