Reinforcement Learning with Dynamic Boltzmann Softmax Updates.

Ling Pan Qingpeng Cai Qi Meng Wei Chen Longbo Huang Tie-Yan Liu

Published in: CoRR (2019)

Keyphrases

reinforcement learning
dynamic environments
temporal difference learning
function approximation
real time
neural network
machine learning
temporal difference
data sets
learning algorithm
artificial intelligence
state space
model free