Non-Markovian policies occupancy measures.

Romain Laroche Remi Tachet des Combes Jacob Buckman

Published in: CoRR (2022)

Keyphrases

decision processes
reinforcement learning agents
reinforcement learning
markov decision process
artificial intelligence
information retrieval
dynamic environments
evaluation measures
stochastic process
quantitative measures