Research on image caption generation method based on multi-modal pre-training model and text mixup optimization.

Published in: Signal Image Video Process. (2024)

Keyphrases