Local policy search with Bayesian optimization.

Sarah Müller Alexander von Rohr Sebastian Trimpe

Published in: CoRR (2021)

Keyphrases

policy search
reinforcement learning
bayesian networks
dynamic programming
optimization method
optimization methods
reward function
continuous state
monte carlo methods
markov chain
sufficient conditions
maximum entropy
reinforcement learning algorithms