Optimizing Expectation with Guarantees in POMDPs.

Krishnendu Chatterjee Petr Novotný Guillermo A. Pérez Jean-François Raskin Dorde Zikelic

Published in: AAAI (2017)

Keyphrases

reinforcement learning
partially observable markov decision processes
belief state
dynamic programming
partially observable
information retrieval
state space
initial state
neural network
distributed constraint optimization
mobile robot
probability distribution
optimal policy
markov decision processes
partial observability
policy search