Stochastic Multi-Armed Bandits with Unrestricted Delay Distributions.

Tal Lancewicki Shahar Segal Tomer Koren Yishay Mansour

Published in: ICML (2021)

Keyphrases

multi armed bandits
multi armed bandit
bandit problems
probability distribution
random variables
monte carlo
stochastic processes
machine learning
kullback leibler divergence