Integrating Vision Transformer-Based Bilinear Pooling and Attention Network Fusion of RGB and Skeleton Features for Human Action Recognition.

Published in: Int. J. Comput. Intell. Syst. (2023)

Keyphrases