Multi-Granularity Contrastive Cross-Modal Collaborative Generation for End-to-End Long-Term Video Question Answering.

Published in: IEEE Trans. Image Process. (2024)

Keyphrases