Spatiotemporal Representation Enhanced ViT for Video Recognition.

Min Li Fengfa Li Bo Meng Ruwen Bai Junxing Ren Zihao Huang Chenghua Gao

Published in: MMM (1) (2024)

Keyphrases