Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training.

Published in: CoRR (2023)

Keyphrases