Towards cross-modal pre-training and learning tempo-spatial characteristics for audio recognition with convolutional and recurrent neural networks.

Published in: EURASIP J. Audio Speech Music. Process. (2020)

Keyphrases