D-CPT Law: Domain-specific Continual Pre-Training Scaling Law for Large Language Models.

Haoran Que Jiaheng Liu Ge Zhang Chenchen Zhang Xingwei Qu Yinghao Ma Feiyu Duan Zhiqi Bai Jiakai Wang Yuanxing Zhang Xu Tan Jie Fu Wenbo Su Jiamang Wang Lin Qu Bo Zheng

Published in: CoRR (2024)