Publication: Multimodal video concept classification based on convolutional neural network and audio feature combination.