A Unified Framework for Alternating Offline Model Training and Policy Learning.

Shentao Yang Shujian Zhang Yihao Feng Mingyuan Zhou

Published in: CoRR (2022)

Keyphrases

learning mechanism
mathematical model
supervised learning
computational model
learning scheme
online learning
learning algorithm
learning models
probabilistic model
reinforcement learning
similarity measure
prior knowledge
training set
machine learning
probability distribution
learning tasks
learning problems
training algorithm
learning phase
learned models
recurrent networks
training program