Calibrated Model-Based Deep Reinforcement Learning.

Ali Malik Volodymyr Kuleshov Jiaming Song Danny Nemer Harlan Seymour Stefano Ermon

Published in: ICML (2019)

Keyphrases

reinforcement learning
model free
function approximation
temporal difference
markov decision processes
case study
optimal policy
machine learning
decision making
multi agent
reinforcement learning algorithms
optimal control
multi agent reinforcement learning
reinforcement learning methods
markov decision process
learning problems
multi view
learning process
website
computer vision