Internally Rewarded Reinforcement Learning.

Mengdi Li Xufeng Zhao Jae Hee Lee Cornelius Weber Stefan Wermter

Published in: ICML (2023)

Keyphrases

reinforcement learning
function approximation
partially observable
state space
markov decision processes
model free
data sets
machine learning
optimal policy
robotic control
control problems
dynamic programming
learning problems
reinforcement learning methods
reinforcement learning algorithms
database
multi agent
temporal difference
transfer learning
expert systems
objective function
continuous state
multi agent reinforcement learning
policy search
case study
partially observable domains
direct policy search