Sign in

Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre. Étude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving.

Guillaume J. LaurentEmmanuel Piat
Published in: Rev. d'Intelligence Artif. (2006)
Keyphrases
  • reinforcement learning
  • monte carlo
  • real time
  • databases
  • knowledge base
  • multi agent