Tri-Modal Dense Video Captioning Based on Fine-Grained Aligned Text and Anchor-Free Event Proposals Generator.

Published in: Int. J. Pattern Recognit. Artif. Intell. (2022)

Keyphrases