Bayesian Optimization for Policy Search via Online-Offline Experimentation.

Benjamin Letham Eytan Bakshy

Published in: J. Mach. Learn. Res. (2019)

Keyphrases

policy search
reinforcement learning
bayesian networks
optimization method
reinforcement learning algorithms
policy gradient
objective function
control system
dynamic programming
mobile robot
dynamic environments