Deep Vision Transformer and T5-Based for Image Captioning.

Khang Nhut Lam Huy Thanh Nguyen Vinh Phuoc Mai Jugal Kalita

Published in: RIVF (2023)

Keyphrases