A Policy Gradient Primal-Dual Algorithm for Constrained MDPs with Uniform PAC Guarantees.

Toshinori Kitamura Tadashi Kozuno Masahiro Kato Yuki Ichihara Soichiro Nishimori Akiyoshi Sannai Sho Sonoda Wataru Kumagai Yutaka Matsuo

Published in: CoRR (2024)

Keyphrases