Reinforcement learning with rare significant events: direct policy search vs. gradient policy search.

Published in: GECCO Companion (2021)

Keyphrases