Gradient Shaping for Multi-Constraint Safe Reinforcement Learning.

Yihang Yao Zuxin Liu Zhepeng Cen Peide Huang Tingnan Zhang Wenhao Yu Ding Zhao

Published in: CoRR (2023)

Keyphrases

reinforcement learning
reward shaping
reinforcement learning algorithms
model free
markov decision processes
learning algorithm
policy gradient
optimal policy
state space
dynamic programming
machine learning
function approximation
action selection
constraint networks
image gradient
complex domains
multi agent reinforcement learning