Audio-Visual Generalized Zero-Shot Learning using Pre-Trained Large Multi-Modal Models.

Published in: CoRR (2024)

Keyphrases