Nonlinear Distributional Gradient Temporal-Difference Learning.

Chao Qu Shie Mannor Huan Xu

Published in: ICML (2019)

Keyphrases

temporal difference learning
function approximation
fixed point
evaluation function
game playing
reinforcement learning
approximate value iteration
temporal difference
monte carlo
reinforcement learning algorithms
decision making
markov decision process
learning algorithm
support vector machine svm
regression model
model selection
cost function
training data
policy iteration
machine learning