MeMViT: Memory-Augmented Multiscale Vision Transformer for Efficient Long-Term Video Recognition.

Published in: CVPR (2022)

Keyphrases