Enabling Multimodal Generation on CLIP via Vision-Language Knowledge Distillation.

Wenliang Dai Lu Hou Lifeng Shang Xin Jiang Qun Liu Pascale Fung

Published in: CoRR (2022)

Keyphrases

domain knowledge
computer vision
prior knowledge
language learning
real time
knowledge acquisition
information systems
multimedia
representation language
knowledge management
background knowledge
specification language
audio visual
knowledge sources
conceptual model
knowledge sharing
higher level
multi modal
programming language
knowledge discovery
knowledge representation
expert systems
natural language
data sets