MAVD: The First Open Large-Scale Mandarin Audio-Visual Dataset with Depth Information.

Published in: INTERSPEECH (2023)

Keyphrases