Adaptive Symmetric Reward Noising for Reinforcement Learning.

Refael Vivanti Talya D. Sohlberg-Baris Shlomo Cohen Orna Cohen

Published in: CoRR (2019)

Keyphrases

reinforcement learning
learning capabilities
adaptive control
eligibility traces
machine learning
function approximation
reinforcement learning algorithms
learning algorithm
partially observable environments
markov decision processes
model free
learning problems
reward function
optimal policy
policy iteration
temporal difference learning
actor critic
dynamic programming
robotic control
optimal control
reinforcement learning methods
multi agent
agent receives