LanguageBind: Extending Video-Language Pretraining to N-modality by Language-based Semantic Alignment.

Bin Zhu Bin Lin Munan Ning Yang Yan Jiaxi Cui Hongfa Wang Yatian Pang Wenhao Jiang Junwu Zhang Zongwei Li Caiwan Zhang Zhifeng Li Wei Liu Li Yuan

Published in: ICLR (2024)

Keyphrases