Unsupervised cross-modal audio representation learning from unstructured multilingual text.

Alexander Schindler Sergiu Gordea Peter Knees

Published in: SAC (2020)

Keyphrases

cross modal
perceptual information
multi modal
visual recognition
supervised learning
learning algorithm
multimedia
keywords
digital libraries
e learning
image retrieval
text mining