Speaker consistency loss and step-wise optimization for semi-supervised joint training of TTS and ASR using unpaired text data.

Published in: CoRR (2022)

Keyphrases