EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL.

Published in: ICML (2021)

Keyphrases