A Primer on Maximum Causal Entropy Inverse Reinforcement Learning.

Adam Gleave Sam Toyer

Published in: CoRR (2022)

Keyphrases

inverse reinforcement learning
bayesian nonparametric
partially observable environments
preference elicitation
reward function
bayesian networks
dynamical systems
simple examples