Towards accurate unsupervised video captioning with implicit visual feature injection and explicit.

Published in: Pattern Recognit. Lett. (2024)

Keyphrases