Multimodal Visual-Semantic Representations Learning for Scene Text Recognition.

Published in: ACM Trans. Multim. Comput. Commun. Appl. (2024)

Keyphrases