Sustainable Online Reinforcement Learning for Auto-bidding.

Zhiyu Mou Yusen Huo Rongquan Bai Mingzhou Xie Chuan Yu Jian Xu Bo Zheng

Published in: NeurIPS (2022)

Keyphrases

reinforcement learning
online learning
state space
management system
function approximation
reinforcement learning algorithms
multi agent reinforcement learning
learning algorithm
decision making
cooperative
optimal policy
dynamical systems
markov decision processes
reinforcement learning methods
online environment