ReMax: A Simple, Effective, and Efficient Reinforcement Learning Method for Aligning Large Language Models.

Published in: CoRR (2023)

Keyphrases