Prompting Large Language Models with Fine-Grained Visual Relations from Scene Graph for Visual Question Answering.

Published in: ICASSP (2024)

Keyphrases