Learning in Congestion Games with Bandit Feedback.

Qiwen Cui Zhihan Xiong Maryam Fazel Simon S. Du

Published in: NeurIPS (2022)

Keyphrases

learning process
learning algorithm
active learning
reinforcement learning
objective function
cooperative
probability distribution
e learning
multi agent
cost function
multiagent learning