Offline Actor-Critic Reinforcement Learning Scales to Large Models.

Jost Tobias Springenberg Abbas Abdolmaleki Jingwei Zhang Oliver Groth Michael Bloesch Thomas Lampe Philemon Brakel Sarah Bechtle Steven Kapturowski Roland Hafner Nicolas Heess Martin A. Riedmiller

Published in: CoRR (2024)

Keyphrases