Fine-Grained Human Feedback Gives Better Rewards for Language Model Training.

Published in: CoRR (2023)

Keyphrases