ViLaM: A Vision-Language Model with Enhanced Visual Grounding and Generalization Capability.

Xiaoyu Yang Lijian Xu Hongsheng Li Shaoting Zhang

Published in: CoRR (2023)

Keyphrases

language model
language modeling
n gram
speech recognition
document retrieval
retrieval model
information retrieval
query expansion
language modelling
probabilistic model
context sensitive
ad hoc information retrieval
visual features
test collection
statistical language models
query terms
pseudo relevance feedback
language model for information retrieval
smoothing methods
mixture model
relevance model
language models for information retrieval
word clouds
retrieval effectiveness
statistical machine translation
translation model
text mining
clustering algorithm