Text-Free Image-to-Speech Synthesis Using Learned Segmental Units.

Wei-Ning Hsu David Harwath Tyler Miller Christopher Song James R. Glass

Published in: ACL/IJCNLP (1) (2021)

Keyphrases