Convergent Actor-Critic Algorithms Under Off-Policy Training and Function Approximation.

Hamid Reza Maei

Published in: CoRR (2018)

Keyphrases

function approximation
reinforcement learning
temporal difference
function approximators
model free
actor critic
radial basis function
learning algorithm
machine learning algorithms
learning tasks
optimization methods
temporal difference learning
decision trees
supervised learning
neuro fuzzy