Offline Reinforcement Learning with Closed-Form Policy Improvement Operators.

Jiachen Li Edwin Zhang Ming Yin Qinxun Bai Yu-Xiang Wang William Yang Wang

Published in: ICML (2023)

Keyphrases

generalized gaussian density
closed form
reinforcement learning
optimal policy
policy search
action selection
markov decision process
function approximators
state space
point correspondences
closed form solutions
function approximation
markov decision processes
reward function
reinforcement learning algorithms
action space
dynamic programming
iterative procedure
closed form expressions
model free
motion estimation
control policy
multiresolution