Policy Gradient for Continuing Tasks in Discounted Markov Decision Processes.

Santiago Paternain Juan Andrés Bazerque Alejandro Ribeiro

Published in: IEEE Trans. Autom. Control. (2022)