Enabling High-Sparsity Foundational Llama Models with Efficient Pretraining and Deployment.

Abhinav Agarwalla Abhay Gupta Alexandre Marques Shubhra Pandit Michael Goin Eldar Kurtic Kevin Leong Tuan Nguyen Mahmoud Salem Dan Alistarh Sean Lie Mark Kurtz

Published in: CoRR (2024)

Keyphrases