VLDeformer: Vision-Language Decomposed Transformer for fast cross-modal retrieval.

Published in: Knowl. Based Syst. (2022)

Keyphrases