Direct Policy Gradients: Direct Optimization of Policies in Discrete Action Spaces.

Guy Lorberbom Chris J. Maddison Nicolas Heess Tamir Hazan Daniel Tarlow

Published in: CoRR (2019)

Keyphrases