Flow to Better: Offline Preference-based Reinforcement Learning via Preferred Trajectory Generation.

Published in: ICLR (2024)

Keyphrases