A Simple Reward-free Approach to Constrained Reinforcement Learning.

Sobhan Miryoosefi Chi Jin

Published in: CoRR (2021)

Keyphrases

reinforcement learning
function approximation
reinforcement learning algorithms
decision making
state space
temporal difference
optimal policy
policy search
average reward
reward function
model free
markov decision processes
data mining
supervised learning
dynamic programming
case study
artificial intelligence