Audio-visual training for improved grounding in video-text LLMs.

Shivprasad Sagare Hemachandran S Kinshuk Sarabhai Prashant Ullegaddi Rajeshkumar SA

Published in: CoRR (2024)

Keyphrases