Preference-based reinforcement learning: evolutionary direct policy search using a preference-based racing algorithm.

Published in: Mach. Learn. (2014)

Keyphrases