Leveraging Acoustic Contextual Representation by Audio-textual Cross-modal Learning for Conversational ASR.

Published in: INTERSPEECH (2022)

Keyphrases