LLaVA-Grounding: Grounded Visual Chat with Large Multimodal Models.

Hao Zhang Hongyang Li Feng Li Tianhe Ren Xueyan Zou Shilong Liu Shijia Huang Jianfeng Gao Lei Zhang Chunyuan Li Jianwei Yang

Published in: CoRR (2023)

Keyphrases