The Multimodal Information Based Speech Processing (MISP) 2023 Challenge: Audio-Visual Target Speaker Extraction.

Shilong Wu Chenxi Wang Hang Chen Yusheng Dai Chenyue Zhang Ruoyu Wang Hongbo Lan Jun Du Chin-Hui Lee Jingdong Chen Shinji Watanabe Sabato Marco Siniscalchi Odette Scharenborg Zhong-Qiu Wang Jia Pan Jianqing Gao

Published in: CoRR (2023)

Keyphrases