PC-MLP: Model-based Reinforcement Learning with Policy Cover Guided Exploration.

Yuda Song Wen Sun

Published in: CoRR (2021)

Keyphrases

guided exploration
model based reinforcement learning
markov decision processes
optimal policy
exploratory learning
markov decision problems
multilayer perceptron
policy iteration
markov decision process
neural network
partially observable markov decision processes
infinite horizon
decision processes
state space
reinforcement learning
action space
finite state
average cost
partially observable
dynamic programming
decision theoretic
decision problems
radial basis function
learning styles
computer simulation
sufficient conditions
learning algorithm