Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism.

Paria Rashidinejad Banghua Zhu Cong Ma Jiantao Jiao Stuart Russell

Published in: CoRR (2021)

Keyphrases

imitation learning
reinforcement learning
reinforcement learning methods
function approximation
state space
reinforcement learning algorithms
control problems
real time
model free
optimal policy
temporal difference
transfer learning
markov decision processes
humanoid robot
machine learning
hidden state
learning algorithm
learning process
multi agent
training data
optimal control
maximum margin
action selection
dynamic programming
computer vision
learning classifier systems
pattern classification
supervised learning
learning capabilities
function approximators