CoBERL: Contrastive BERT for Reinforcement Learning.

Andrea Banino Adrià Puigdomènech Badia Jacob C. Walker Tim Scholtes Jovana Mitrovic Charles Blundell

Published in: CoRR (2021)

Keyphrases

reinforcement learning
function approximation
multi agent
reinforcement learning algorithms
robotic control
model free
optimal policy
machine learning
dynamic programming
markov decision processes
temporal difference learning
state space
temporal difference
control problems
evolutionary learning
multi agent reinforcement learning
active learning
learning process
optimal control
neural network
action space
relational reinforcement learning
database