CISum: Learning Cross-modality Interaction to Enhance Multimodal Semantic Coverage for Multimodal Summarization.

Published in: CoRR (2023)

Keyphrases