ProVLA: Compositional Image Search with Progressive Vision-Language Alignment and Multimodal Fusion.

Published in: ICCV (Workshops) (2023)

Keyphrases