Attention as Grounding: Exploring Textual and Cross-Modal Attention on Entities and Relations in Language-and-Vision Transformer.

Published in: ACL (Findings) (2022)

Keyphrases