Unified Language-Vision Pretraining in LLM with Dynamic Discrete Visual Tokenization.

Yang Jin Kun Xu Kun Xu Liwei Chen Chao Liao Jianchao Tan Quzhe Huang Bin Chen Chenyi Lei An Liu Chengru Song Xiaoqiang Lei Di Zhang Wenwu Ou Kun Gai Yadong Mu

Published in: CoRR (2023)