Stochastic Multi-Armed-Bandit Problem with Non-stationary Rewards.

Yonatan Gur Assaf J. Zeevi Omar Besbes

Published in: NIPS (2014)

Keyphrases

non stationary
fractional brownian motion
markov processes
markov decision processes
random fields
adaptive algorithms
reinforcement learning
white noise
autoregressive
stock price
blind source separation
temporal evolution
empirical mode decomposition
total reward
multi armed bandit