Differentially Private Regret Minimization in Episodic Markov Decision Processes.

Sayak Ray Chowdhury Xingyu Zhou

Published in: CoRR (2021)

Keyphrases

markov decision processes
differentially private
regret minimization
nash equilibrium
differential privacy
game theoretic
finite state
state space
optimal policy
reinforcement learning
dynamic programming
policy iteration
transition matrices
decision theoretic planning
action space
markov decision process
average cost
infinite horizon
average reward
stochastic games
model selection
data mining
reinforcement learning algorithms
game theory
multi agent learning
reward function
privacy preserving