Action-Gap Phenomenon in Reinforcement Learning.

Amir Massoud Farahmand

Published in: NIPS (2011)

Keyphrases

reinforcement learning
action selection
partially observable domains
state action
action space
reward shaping
state space
human actions
function approximation
fitted q iteration
agent learns
optimal control
temporal difference
transition model
model free
markov decision processes
optimal policy
supervised learning
multi agent
learning capabilities
partially observable
dynamical systems
temporal difference learning
stochastic approximation
autonomous learning
multi agent reinforcement learning
action recognition
robotic control
spatio temporal