Unsupervised inverse reinforcement learning with noisy data.

Published in: CDC (2014)

Keyphrases

noisy data
inverse reinforcement learning
bayesian nonparametric
partially observable environments
preference elicitation
high dimensional
unsupervised learning
missing data
training data
supervised learning
reward function
semi supervised
missing values
temporal difference
expectation maximization
input data
active learning
reinforcement learning