Learning adaptive control in dynamic environments using reproducing kernel priors with bayesian policy gradients.

Published in: SAC (2022)

Keyphrases