From Importance Sampling to Doubly Robust Policy Gradient.

Jiawei Huang Nan Jiang

Published in: ICML (2020)

Keyphrases

importance sampling
monte carlo
variance reduction
policy gradient
markov chain
particle filter
kalman filter
particle filtering
approximate inference
machine learning
hidden markov models
markov chain monte carlo