Generating diverse and natural text-to-speech samples using a quantized fine-grained VAE and auto-regressive prosody prior.

Published in: CoRR (2020)

Keyphrases