Adaptive Temporal-Difference Learning for Policy Evaluation with Per-State Uncertainty Estimates.

Published in: NeurIPS (2019)

Keyphrases