Reinforcement Learning in Parametric MDPs with Exponential Families.

Sayak Ray Chowdhury Aditya Gopalan Odalric-Ambrym Maillard

Published in: AISTATS (2021)

Keyphrases