Comparing normalizing flows and diffusion models for prosody and acoustic modelling in text-to-speech.

Guangyan Zhang Thomas Merritt Manuel Sam Ribeiro Biel Tura Vecino Kayoko Yanagisawa Kamil Pokora Abdelhamid Ezzerg Sebastian Cygert Ammar Abbas Piotr Bilinski Roberto Barra-Chicote Daniel Korzekwa Jaime Lorenzo-Trueba

Published in: CoRR (2023)

Keyphrases