MLS: A Large-Scale Multilingual Dataset for Speech Research.

Vineel Pratap Qiantong Xu Anuroop Sriram Gabriel Synnaeve Ronan Collobert

Published in: CoRR (2020)

Keyphrases

multi lingual
speech recognition
small scale
real world
language acquisition
real life
endpoint detection
audio visual
benchmark datasets
digital libraries
cross lingual
broadcast news
speech signal
training dataset
automatic speech recognition
spoken language
text generation
cross language
database
text classification
hidden markov models
neural network