Diffusion gradient temporal difference for cooperative reinforcement learning with linear function approximation.

Published in: CIP (2012)

Keyphrases