ELIP: Efficient Language-Image Pre-training with Fewer Vision Tokens.

Yangyang Guo Haoyu Zhang Liqiang Nie Yongkang Wong Mohan S. Kankanhalli

Published in: CoRR (2023)

Keyphrases