Improving Optimality of Neural Rewards Regression for Data-Efficient Batch Near-Optimal Policy Identification.

Published in: ICANN (1) (2007)

Keyphrases