The Point to Which Soft Actor-Critic Converges.

Published in: Tiny Papers @ ICLR (2023)

Keyphrases

actor critic
reinforcement learning
policy gradient
neuro fuzzy
optimal control
temporal difference
approximate dynamic programming
gradient method
optimal solution
reinforcement learning algorithms
least squares
fixed point