Lumos : Empowering Multimodal LLMs with Scene Text Recognition.

Ashish Shenoy Yichao Lu Srihari Jayakumar Debojeet Chatterjee Mohsen Moslehpour Pierce Chuang Abhay Harpale Vikas Bhardwaj Di Xu Shicong Zhao Longfang Zhao Ankit Ramchandani Xin Luna Dong Anuj Kumar

Published in: CoRR (2024)

Keyphrases