Explorer-Actor-Critic: Better actors for deep reinforcement learning.

Junwei Zhang Shuai Han Xi Xiong Sheng Zhu Shuai Lü

Published in: Inf. Sci. (2024)

Keyphrases

actor critic
reinforcement learning
approximate dynamic programming
policy gradient
temporal difference
reinforcement learning algorithms
optimal control
gradient method
neuro fuzzy
policy iteration
function approximation
learning algorithm
rl algorithms
control problems
model free
markov decision processes
supervised learning
state space
reinforcement learning methods
dynamic programming
multi agent
machine learning
control strategy
learning problems
fixed point
partially observable
control policy
fuzzy logic
policy gradient methods