GIT: A Generative Image-to-text Transformer for Vision and Language.

Published in: Trans. Mach. Learn. Res. (2022)

Keyphrases