Piecewise-Stationary Combinatorial Semi-Bandit with Causally Related Rewards.

Behzad Nourani-Koliji Steven Bilaj Amir Rezaei Balef Setareh Maghsudi

Published in: CoRR (2023)

Keyphrases

bandit problems
non stationary
database
learning algorithm
reinforcement learning
artificial neural networks
information retrieval
information systems
multiscale
optimal solution
markov chain
random sampling