Predicting phoneme-level prosody latents using AR and flow-based Prior Networks for expressive speech synthesis.

Published in: CoRR (2022)

Keyphrases