CoVLR: Coordinating Cross-Modal Consistency and Intra-Modal Structure for Vision-Language Retrieval.

Yang Yang Zhongtian Fu Xiangyu Wu Wenjie Li

Published in: CoRR (2023)

Keyphrases

cross modal
multi modal
multimedia retrieval
image retrieval
visual recognition
multimedia databases
computer vision
visual similarity
image database
test collection
retrieval systems
text retrieval
multimedia information retrieval
information retrieval
information retrieval systems
xml documents
high dimensional
indexing structure
keywords
multimedia