Minimizing Maximum Regret in Commitment Constrained Sequential Decision Making.

Qi Zhang Satinder P. Singh Edmund H. Durfee

Published in: CoRR (2017)

Keyphrases

sequential decision making
decision problems
reinforcement learning
interactive dynamic influence diagrams
influence diagrams
temporal difference
online learning
lower bound
expected utility
worst case
computational complexity
decision making
data mining
neural network
active learning
game theory
pairwise
training set
reinforcement learning algorithms