Instruction-ViT: Multi-modal prompts for instruction learning in vision transformer.

Zhenxiang Xiao Yuzhong Chen Junjie Yao Lu Zhang Zhengliang Liu Zihao Wu Xiaowei Yu Yi Pan Lin Zhao Chong Ma Xinyu Liu Wei Liu Xiang Li Yixuan Yuan Dinggang Shen Dajiang Zhu Dezhong Yao Tianming Liu Xi Jiang

Published in: Inf. Fusion (2024)

Keyphrases