Bias Resilient Multi-Step Off-Policy Goal-Conditioned Reinforcement Learning.

Lisheng Wu Ke Chen

Published in: CoRR (2023)

Keyphrases

multi step
reinforcement learning
model free
function approximation
single step
lower bounding
distance computation
machine learning
knn
learning algorithm
learning process
state space
markov decision processes
td learning