Fine-Grained Human Feedback Gives Better Rewards for Language Model Training.

Published in: NeurIPS (2023)

Keyphrases