3D-VisTA: Pre-trained Transformer for 3D Vision and Text Alignment.

Ziyu Zhu Xiaojian Ma Yixin Chen Zhidong Deng Siyuan Huang Qing Li

Published in: ICCV (2023)

Keyphrases

pre trained
computer vision
real time
training data
vision system
training examples
text mining