DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning.

Published in: CoRR (2024)

Keyphrases