Near-Optimal Reinforcement Learning with Self-Play under Adaptivity Constraints.

Dan Qiao Yu-Xiang Wang

Published in: CoRR (2024)

Keyphrases

reinforcement learning
state space
constraint satisfaction
dynamic programming
real time
data sets
multi agent
markov decision processes
databases
search engine
multi agent systems
pairwise
co occurrence
constraint programming
function approximation
temporal difference learning