PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction.

Fengshuo Bai Hongming Zhang Tianyang Tao Zhiheng Wu Yanna Wang Bo Xu

Published in: AAAI (2023)

Keyphrases

multi task
reinforcement learning
optimal policy
transfer learning
multi task learning
policy search
learning problems
learning tasks
function approximators
multitask learning
multiple tasks
reward function
markov decision processes
feature selection
multi class
gaussian processes
sparse learning
state space
learning algorithm
labeled data
learning models
kernel methods
supervised learning
inductive learning
active learning
learning process
training set
machine learning