Talking Head Generation with Probabilistic Audio-to-Visual Diffusion Priors.

Zhentao Yu Zixin Yin Deyu Zhou Duomin Wang Finn Wong Baoyuan Wang

Published in: CoRR (2022)

Keyphrases

visual information
visual data
cross modal
learned from training data
prior probabilities
visual features
multimedia
visual cues
audio visual
probabilistic model
diffusion process
low level
generation process
anisotropic diffusion
uncertain data
signal processing
bayesian networks
real time
multimodal information
generalized em algorithm
multi modal
video sequences
visual perception
eye tracking
visual field
audio files
video indexing and retrieval
social networks