Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone.

Zi-Yi Dou Aishwarya Kamath Zhe Gan Pengchuan Zhang Jianfeng Wang Linjie Li Zicheng Liu Ce Liu Yann LeCun Nanyun Peng Jianfeng Gao Lijuan Wang

Published in: CoRR (2022)