Stack-VS: Stacked Visual-Semantic Attention for Image Caption Generation.

Ling Cheng Wei Wei Xianling Mao Yong Liu Chunyan Miao

Published in: IEEE Access (2020)

Keyphrases