A free lunch from ViT: adaptive attention multi-scale fusion Transformer for fine-grained visual recognition.

Published in: ICASSP (2022)

Keyphrases