Inverse Reinforcement Learning With Constraint Recovery.

Nirjhar Das Arpan Chattopadhyay

Published in: CoRR (2023)

Keyphrases

inverse reinforcement learning
partially observable environments
bayesian nonparametric
preference elicitation
reward function
decision making
temporal difference
monte carlo
dynamic systems