MM-TTS: Multi-Modal Prompt Based Style Transfer for Expressive Text-to-Speech Synthesis.

Published in: AAAI (2024)

Keyphrases