OPAC: Opportunistic Actor-Critic.

Srinjoy Roy Saptam Bakshi Tamal Maharaj

Published in: CoRR (2020)

Keyphrases

actor critic
reinforcement learning
optimal control
policy gradient
approximate dynamic programming
temporal difference
neuro fuzzy
gradient method
reinforcement learning algorithms
policy iteration
function approximation
average reward
model free
state space
evaluation function
linear program
optimization methods
linear programming
dynamic programming
neural network