Extrapolation in Gridworld Markov-Decision Processes.

Eugene Charniak

Published in: CoRR (2020)

Keyphrases

markov decision processes
state space
optimal policy
finite state
transition matrices
reinforcement learning
dynamic programming
policy iteration
decision theoretic planning
average cost
markov decision process
partially observable
factored mdps
action sets
finite horizon
decision processes
planning under uncertainty
average reward
interval estimation
model based reinforcement learning
reachability analysis
action space
state and action spaces
reinforcement learning algorithms
long run
risk sensitive
decision theoretic
machine learning
infinite horizon
search space