Linear Combinatorial Semi-Bandit with Causally Related Rewards.

Behzad Nourani-Koliji Saeed Ghoorchian Setareh Maghsudi

Published in: CoRR (2022)

Keyphrases

bandit problems
reinforcement learning
data mining
markov decision processes
data sets
decision making
databases
dynamic programming
closely related