mPLUG: Effective and Efficient Vision-Language Learning by Cross-modal Skip-connections.

Chenliang Li Haiyang Xu Junfeng Tian Wei Wang Ming Yan Bin Bi Jiabo Ye Hehong Chen Guohai Xu Zheng Cao Ji Zhang Songfang Huang Fei Huang Jingren Zhou Luo Si

Published in: CoRR (2022)

Keyphrases