Hierarchical Timbre-Cadence Speaker Encoder for Zero-shot Speech Synthesis.

Published in: INTERSPEECH (2023)

Keyphrases