BASE TTS: Lessons from building a billion-parameter Text-to-Speech model on 100K hours of data.

Mateusz Lajszczak Guillermo Cámbara Yang Li Fatih Beyhan Arent van Korlaar Fan Yang Arnaud Joly Álvaro Martín-Cortinas Ammar Abbas Adam Michalski Alexis Moinet Sri Karlapati Ewa Muszynska Haohan Guo Bartosz Putrycz Soledad López Gambino Kayeon Yoo Elena Sokolova Thomas Drugman

Published in: CoRR (2024)