Sample-Efficient Learning of POMDPs with Multiple Observations In Hindsight.

Jiacheng Guo Minshuo Chen Huan Wang Caiming Xiong Mengdi Wang Yu Bai

Published in: ICLR (2024)

Keyphrases

efficient learning
reinforcement learning
learning algorithm
bayes net
structured prediction
log linear models
dynamic programming
artificial intelligence
database systems
sample size
business process
belief state
partially observable