Improving Audio Generation with Visual Enhanced Caption.

Yi Yuan Dongya Jia Xiaobin Zhuang Yuanzhe Chen Zhengxi Liu Zhuo Chen Yuping Wang Yuxuan Wang Xubo Liu Mark D. Plumbley Wenwu Wang

Published in: CoRR (2024)