DNN driven Speaker Independent Audio-Visual Mask Estimation for Speech Separation.

Mandar Gogate Ahsan Adeel Ricard Marxer Jon Barker Amir Hussain

Published in: CoRR (2018)

Keyphrases

audio visual
digit recognition
speaker independent
multi modal
speech recognition
visual information
speaker dependent
multi stream
visual data
audio features
emotion recognition
sound source
speaker verification
multimedia
hidden markov models
speaker identification
audio visual speech recognition
speech recognizer
n gram
computer vision
information retrieval