D-MmT: A concise decoder-only multi-modal transformer for abstractive summarization in videos.

Published in: Neurocomputing (2021)

Keyphrases