Frugal Actor-Critic: Sample Efficient Off-Policy Deep Reinforcement Learning Using Unique Experiences.

Nikhil Kumar Singh Indranil Saha

Published in: CoRR (2024)

Keyphrases

reinforcement learning
actor critic
function approximation
temporal difference
reinforcement learning algorithms
policy iteration
gradient method
approximate dynamic programming
multi agent
markov decision processes
neuro fuzzy
policy gradient
dynamic programming
optimal policy
optimal control
model free