WARM: On the Benefits of Weight Averaged Reward Models.

Alexandre Ramé Nino Vieillard Léonard Hussenot Robert Dadashi Geoffrey Cideron Olivier Bachem Johan Ferret

Published in: CoRR (2024)

Keyphrases