Policy Iteration Based on a Learned Transition Model.

Vivek Ramavajjala Charles Elkan

Published in: ECML/PKDD (2) (2012)

Keyphrases