Publication: Multimodal object recognition from visual and audio sequences.