Quantized Reinforcement Learning (QUARL).

Srivatsan Krishnan Sharad Chitlangia Maximilian Lam Zishen Wan Aleksandra Faust Vijay Janapa Reddi

Published in: CoRR (2019)

Keyphrases

reinforcement learning
reinforcement learning algorithms
temporal difference
model free
function approximation
state space
temporal difference learning
optimal control
markov decision processes
machine learning
robotic control
control problems
dct coefficients
transfer learning
optimal policy
learning process
learning algorithm
neural network
learning tasks
dynamic programming
search space
decision trees
website
knowledge base
markov decision process
genetic algorithm
policy search
direct policy search