Bridging the gap: dual perception attention and local-global similarity fusion for cross-modal image-text matching.

Published in: Multim. Tools Appl. (2024)

Keyphrases