IndicLLMSuite: A Blueprint for Creating Pre-training and Fine-Tuning Datasets for Indian Languages.

Mohammed Safi Ur Rahman Khan Priyam Mehta Ananth Sankar Umashankar Kumaravelan Sumanth Doddapaneni Suriyaprasaad G Varun Balan G Sparsh Jain Anoop Kunchukuttan Pratyush Kumar Raj Dabre Mitesh M. Khapra

Published in: CoRR (2024)

Keyphrases