Convergence and stability analysis of value iteration Q-learning under non-discounted cost for discrete-time optimal control.

Published in: Neurocomputing (2024)

Keyphrases