Adaptive determination of audio and visual weights for automatic speech recognition.

Alexandrina Rogozan Paul Deléglise Mamoun Alissali

Published in: AVSP (1997)

Keyphrases

automatic speech recognition
broadcast news
visual information
speech recognition
acoustic features
visual data
hidden markov models
speech signal
word error rate
conversational speech
speaker identification
recognition errors
spoken words
speech retrieval
video search
noisy environments
multimedia
visual features
low level
word recognition
speech corpus
machine learning
multi modal