Collaborative Spatial-Temporal Modeling for Language-Queried Video Actor Segmentation.

Published in: CVPR (2021)

Keyphrases