Enhancing Curiosity-driven Reinforcement Learning through Historical State Information for Long-term Exploration.

Jian Wang Bo Liu Jing Chen Ting Lei Ke Ni

Published in: ICIEAI (2023)

Keyphrases

state information
long term
reinforcement learning
action space
state space
action selection
markov decision processes
action models
optimal policy
orders of magnitude
markov chain
real valued
markov decision process
dynamic programming
learning algorithm
heuristic search
transfer learning
search strategies
domain specific
mobile robot
decision making