MOSEAC: Streamlined Variable Time Step Reinforcement Learning.

Dong Wang Giovanni Beltrame

Published in: CoRR (2024)

Keyphrases

reinforcement learning
state space
database
function approximation
data sets
information systems
multi agent
search algorithm
optimal policy
markov decision processes
optimal control
temporal difference
multi step
learning capabilities
temporal difference learning