Experimental Results on Learning Stochastic Memoryless Policies for Partially Observable Markov Decision Processes.

Published in: NIPS (1998)

Keyphrases