Publication: Reinforcement Learning-based Mixture of Vision Transformers for Video Violence Recognition.