DREAM: Deep Regret minimization with Advantage baselines and Model-free learning.

Eric Steinberger Adam Lerer Noam Brown

Published in: CoRR (2020)

Keyphrases

model free
reinforcement learning
learning algorithm
learning process
supervised learning
learning problems
learning environment
resource allocation
learning tasks
function approximation
multi agent learning