Adaptive policies for time-varying stochastic systems under discounted criterion.

Nadine Hilgert J. Adolfo Minjárez-Sosa

Published in: Math. Methods Oper. Res. (2001)

Keyphrases

stochastic systems
optimal policy
predictive state representations
sample path
stochastic models
conservation laws
confidence intervals
average cost
markov decision processes
markov decision process
average reward
asymptotic analysis
long run
infinite horizon
feature selection
finite horizon
lost sales
sample size
state space
probabilistic model
dynamic programming