Multi-grained visual pivot-guided multi-modal neural machine translation with text-aware cross-modal contrastive disentangling.

Published in: Neural Networks (2024)

Keyphrases