Leveraging Domain Knowledge for Efficient Reward Modelling in RLHF: A Case-Study in E-Commerce Opinion Summarization.

Swaroop Nath Tejpalsingh Siledar Sankara Sri Raghava Ravindra Muddu Rupasai Rangaraju Harshad Khadilkar Pushpak Bhattacharyya Suman Banerjee Amey Patil Sudhanshu Shekhar Singh Muthusamy Chelliah Nikesh Garera

Published in: CoRR (2024)

Keyphrases