Tell my why: Training preferences-based RL with human preferences and step-level explanations.

Published in: CoRR (2024)

Keyphrases

user preferences
decision making
preference elicitation
multi attribute
data sets
post processing
decision trees
reinforcement learning
multi agent
training set
human behavior
preference relations
virtual humans
soft constraints
individual user
generating explanations