Enhancing Visual Grounding in Vision-Language Pre-Training With Position-Guided Text Prompts.

Published in: IEEE Trans. Pattern Anal. Mach. Intell. (2024)

Keyphrases