Multi-armed Bandit Learning on a Graph.

Tianpeng Zhang Kasper Johansson Na Li

Published in: CISS (2023)

Keyphrases

learning process
reinforcement learning
online learning
learning algorithm
support vector
lower bound
probability distribution
learning tasks