RL4F: Generating Natural Language Feedback with Reinforcement Learning for Repairing Model Outputs.

Published in: ACL (1) (2023)

Keyphrases