Extreme-scale Talking-Face Video Upsampling with Audio-Visual Priors.

Sindhu B. Hegde Rudrabha Mukhopadhyay Vinay P. Namboodiri C. V. Jawahar

Published in: ACM Multimedia (2022)

Keyphrases

audio visual
video summarization
visual data
multimodal fusion
person authentication
multimedia
meeting room
multi modal
audio visual content
audio features
visual information
video data
temporal context
video content
multi stream
video streams
video sequences
multimedia data
audio visual speech recognition
face images
high dimensional data
video analysis
high dimensional
data sets
multiscale
contextual information
video retrieval
video frames