Proximal Policy Optimization with Continuous Bounded Action Space via the Beta Distribution.

Irving G. B. Petrazzini Eric A. Antonelo

Published in: SSCI (2021)

Keyphrases

action space
state space
markov decision processes
state and action spaces
real valued
reinforcement learning
control policies
continuous state spaces
continuous state
beta distribution
markov decision process
action selection
stochastic processes
state action
markov decision problems
continuous action
optimal policy
single agent
markov chain
decision making