VCoder: Versatile Vision Encoders for Multimodal Large Language Models.

Jitesh Jain Jianwei Yang Humphrey Shi

Published in: CoRR (2023)

Keyphrases

language model
language modeling
probabilistic model
n gram
retrieval model
speech recognition
information retrieval
test collection
document retrieval
computer vision
language modelling
context sensitive
query expansion
language models for information retrieval
multi modal
document ranking
statistical language models
retrieval effectiveness
translation model
multimedia
pseudo relevance feedback
relevance model
text retrieval
hidden markov models
vector space model
query specific
document length
machine learning