A Tighter Analysis of Randomised Policy Iteration.

Meet Taraviya Shivaram Kalyanakrishnan

Published in: UAI (2019)

Keyphrases

policy iteration
pairwise
upper bound
markov decision processes
neural network
model free