Reinforcement Learning in Newcomblike Environments.

James Bell Linda Linsefors Caspar Oesterheld Joar Skalse

Published in: NeurIPS (2021)

Keyphrases

reinforcement learning
function approximation
state space
dynamic environments
reinforcement learning algorithms
highly dynamic
temporal difference
multi agent environments
supervised learning
markov decision processes
learning problems
policy search
reinforcement learning methods
multi agent reinforcement learning
direct policy search
robotic control
machine learning
control problems
optimal control
robotic systems
optimal policy
multi agent
computer vision
genetic algorithm