Speech Rhythm-Based Speaker Embeddings Extraction from Phonemes and Phoneme Duration for Multi-Speaker Speech Synthesis.

Published in: IEICE Trans. Inf. Syst. (2024)

Keyphrases