ALLaVA: Harnessing GPT4V-synthesized Data for A Lite Vision-Language Model.

Guiming Hardy Chen Shunian Chen Ruifei Zhang Junying Chen Xiangbo Wu Zhiyi Zhang Zhihong Chen Jianquan Li Xiang Wan Benyou Wang

Published in: CoRR (2024)

Keyphrases