Latent Context Based Soft Actor-Critic.

Yuan Pu Shaochen Wang Xin Yao Bin Li

Published in: IJCNN (2020)

Keyphrases

actor critic
reinforcement learning
optimal control
approximate dynamic programming
policy gradient
neuro fuzzy
temporal difference
gradient method
function approximation
policy iteration
reinforcement learning algorithms
latent variables
markov decision processes
learning algorithm
average reward
dynamic programming
radial basis function
linear program
monte carlo
multi agent