A Multimodal, Multi-Task Adapting Framework for Video Action Recognition.

Published in: AAAI (2024)

Keyphrases