Fusion d'espaces de représentations multimodaux pour la reconnaissance du rôle du locuteur dans des documents télévisuels (Multimodal embedding fusion for robust speaker role recognition in video broadcast ).

Published in: JEP-TALN-RECITAL (1) (2016)

Keyphrases