DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning.

Published in: LREC/COLING (2024)

Keyphrases