Frugal Actor-Critic: Sample Efficient Off-Policy Deep Reinforcement Learning Using Unique Experiences.

Nikhil Kumar Singh Indranil Saha

Published in: AAMAS (2024)

Keyphrases

reinforcement learning
actor critic
function approximation
temporal difference
approximate dynamic programming
learning algorithm
reinforcement learning algorithms
optimal control
machine learning
policy iteration
objective function
multi agent
neuro fuzzy
model free
temporal difference learning
policy gradient