Deep Reinforcement Learning from Policy-Dependent Human Feedback.

Dilip Arumugam Jun Ki Lee Sophie Saskin Michael L. Littman

Published in: CoRR (2019)

Keyphrases