COCA: COllaborative CAusal Regularization for Audio-Visual Question Answering.

Mingrui Lao Nan Pu Yu Liu Kai He Erwin M. Bakker Michael S. Lew

Published in: AAAI (2023)

Keyphrases

audio visual
question answering
passage retrieval
multi modal
visual information
information retrieval
natural language processing
multimedia
named entities
information extraction
natural language
natural language questions
visual data
question answering systems
document collections
email
qa systems
answer extraction