Potential-based reward shaping for finite horizon online POMDP planning.

Adam Eck Leen-Kiat Soh Sam Devlin Daniel Kudenko

Published in: Auton. Agents Multi Agent Syst. (2016)

Keyphrases