RewardBench: Evaluating Reward Models for Language Modeling.

Nathan Lambert Valentina Pyatkin Jacob Morrison LJ Miranda Bill Yuchen Lin Khyathi Raghavi Chandu Nouha Dziri Sachin Kumar Tom Zick Yejin Choi Noah A. Smith Hannaneh Hajishirzi

Published in: CoRR (2024)

Keyphrases