A Generalized Projected Bellman Error for Off-policy Value Estimation in Reinforcement Learning.

Published in: J. Mach. Learn. Res. (2022)

Keyphrases