Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre. Étude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving.
Guillaume J. LaurentEmmanuel PiatPublished in: Rev. d'Intelligence Artif. (2006)