Individual Q-Learning in Normal Form Games.

David S. Leslie Edmund J. Collins

Published in: SIAM J. Control. Optim. (2005)

Keyphrases

cooperative
state space
multi agent
reinforcement learning
learning algorithm
special case
monte carlo
function approximation
machine learning
dynamic programming
probability distribution
linear programming
model free
action selection
stochastic approximation