Can Large Multimodal Models Uncover Deep Semantics Behind Images?

Yixin Yang Zheng Li Qingxiu Dong Heming Xia Zhifang Sui

Published in: CoRR (2024)

Keyphrases