Value Function Approximation in Zero-Sum Markov Games

Michail G. Lagoudakis Ronald Parr

Published in: CoRR (2013)

Keyphrases

markov games
markov decision processes
multiagent reinforcement learning
reinforcement learning algorithms
markov decision process
reinforcement learning
control problems
stochastic games
multiagent systems
state space
optimal policy
nash equilibrium
dynamic programming
finite state
multi agent
model free
infinite horizon
policy iteration
finite horizon
optimal stopping
cooperative
optimal control
temporal difference
action space
function approximation
average cost
temporal difference learning
markov chain