Text-Free Image-to-Speech Synthesis Using Learned Segmental Units.

Wei-Ning Hsu David Harwath Christopher Song James R. Glass

Published in: CoRR (2020)

Keyphrases