Vibe-Eval: A hard evaluation suite for measuring progress of multimodal language models.

Piotr Padlewski Max Bain Matthew Henderson Zhongkai Zhu Nishant Relan Hai Pham Donovan Ong Kaloyan Aleksiev Aitor Ormazabal Samuel Phua Ethan Yeo Eugenie Lamprecht Qi Liu Yuqi Wang Eric Chen Deyu Fu Lei Li Che Zheng Cyprien de Masson d'Autume Dani Yogatama Mikel Artetxe Yi Tay

Published in: CoRR (2024)