Pearl: A Production-ready Reinforcement Learning Agent.

Zheqing Zhu Rodrigo de Salvo Braz Jalaj Bhandari Daniel Jiang Yi Wan Yonathan Efroni Liyuan Wang Ruiyang Xu Hongbo Guo Alex Nikulkov Dmytro Korenkevych Ürün Dogan Frank Cheng Zheng Wu Wanqiao Xu

Published in: CoRR (2023)

Keyphrases

learning agent
reinforcement learning
state space
reinforcement learning algorithms
learning algorithm
solving problems
learning tasks
learning capabilities
selective perception
learning process
function approximation
single agent
reward function
temporal difference
model free
dynamic environments
multi agent
optimal policy
dynamic programming
search algorithm
mixed initiative
artificial intelligence