Does Zero-Shot Reinforcement Learning Exist?

Ahmed Touati Jérémy Rapin Yann Ollivier

Published in: CoRR (2022)

Keyphrases

reinforcement learning
function approximation
multi agent
decision making
control problems
state space
model free
optimal control
optimal policy
direct policy search
machine learning
robotic control
temporal difference
markov decision processes
evolutionary algorithm
learning process
bayesian networks
learning algorithm