Q-learning for history-based reinforcement learning.

Mayank Daswani Peter Sunehag Marcus Hutter

Published in: ACML (2013)

Keyphrases