Decoupled Actor-Critic.

Michal Nauman Marek Cygan

Published in: CoRR (2023)

Keyphrases

actor critic
reinforcement learning
temporal difference
policy gradient
approximate dynamic programming
optimal control
neuro fuzzy
gradient method
function approximation
reinforcement learning algorithms
policy iteration
average reward
markov decision processes
evaluation function
state space
reinforcement learning methods
action selection
linear program
least squares