Constructing Multilingual Visual-Text Datasets Revealing Visual Multilingual Ability of Vision Language Models.

Published in: CoRR (2024)

Keyphrases