Re-ViLM: Retrieval-Augmented Visual Language Model for Zero and Few-Shot Image Captioning.

Zhuolin Yang Wei Ping Zihan Liu Vijay Korthikanti Weili Nie De-An Huang Linxi Fan Zhiding Yu Shiyi Lan Bo Li Ming-Yu Liu Yuke Zhu Mohammad Shoeybi Bryan Catanzaro Chaowei Xiao Anima Anandkumar

Published in: CoRR (2023)