Video Captioning Using Attention Based Visual Fusion with Bi-temporal Context and Bi-modal Semantic Feature Learning.

Published in: AISI (2020)

Keyphrases