EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL.

Published in: CoRR (2020)

Keyphrases