Bounding the optimal value function in compositional reinforcement learning.

Jacob Adamczyk Volodymyr Makarenko Argenis Arriojas Stas Tiomkin Rahul V. Kulkarni

Published in: UAI (2023)