Reinforcement Learning.

Olivier Buffer Olivier Pietquin Paul Weng

Published in: CoRR (2020)

Keyphrases

reinforcement learning
function approximation
model free
reinforcement learning algorithms
state space
robotic control
action selection
machine learning
policy search
stochastic approximation
direct policy search
neural network
optimal control
transfer learning
optimal policy
dynamic programming
markov decision processes
temporal difference
supervised learning
control policy
learning agents
autonomous learning
evolutionary learning
transition model
expert systems
search algorithm
multi agent