Differentiable Arbitrating in Zero-sum Markov Games.

Jing Wang Meichen Song Feng Gao Boyi Liu Zhaoran Wang Yi Wu

Published in: CoRR (2023)

Keyphrases

markov games
markov decision processes
multiagent reinforcement learning
markov decision process
reinforcement learning algorithms
reinforcement learning
control problems
stochastic games
multiagent systems
state space
objective function
nash equilibrium
multi agent
optimal policy
model free
finite state
policy iteration
cooperative
infinite horizon
finite horizon
average cost
optimal control
optimal stopping
nash equilibria