CODIS: Benchmarking Context-Dependent Visual Comprehension for Multimodal Large Language Models.

Fuwen Luo Chi Chen Zihao Wan Zhaolu Kang Qidong Yan Yingjie Li Xiaolong Wang Siyu Wang Ziyue Wang Xiaoyue Mi Peng Li Ning Ma Maosong Sun Yang Liu

Published in: CoRR (2024)