Multimodal Turn-Taking Model Using Visual Cues for End-of-Utterance Prediction in Spoken Dialogue Systems.

Published in: INTERSPEECH (2023)

Keyphrases