Hierarchical & multimodal video captioning: Discovering and transferring multimodal knowledge for vision to language.

Published in: Comput. Vis. Image Underst. (2017)

Keyphrases