Improving Policy Optimization with Generalist-Specialist Learning.

Zhiwei Jia Xuanlin Li Zhan Ling Shuang Liu Yiran Wu Hao Su

Published in: CoRR (2022)

Keyphrases

learning algorithm
learning process
learning problems
online learning
incremental learning
machine learning
feature selection
training data
reinforcement learning
optimal solution
learning environment
probabilistic model
supervised learning
empirical studies
learning tasks
stochastic gradient descent