Shared Experience Actor-Critic for Multi-Agent Reinforcement Learning.

Filippos Christianos Lukas Schäfer Stefano V. Albrecht

Published in: NeurIPS (2020)

Keyphrases

multi agent reinforcement learning
actor critic
reinforcement learning
multi agent
policy gradient
temporal difference
reinforcement learning algorithms
optimal control
learning agents
function approximation
stochastic games
neuro fuzzy
policy iteration
gradient method
multi agent systems
multi agent learning
average reward
model free
machine learning
mathematical model
cooperative
artificial intelligence