A policy optimization algorithm based on sample adaptive reuse and dual-clipping for robotic action control.

Published in: Appl. Soft Comput. (2023)

Keyphrases