Compressing Large Language Models using Low Rank and Low Precision Decomposition.

Rajarshi Saha Naomi Sagan Varun Srivastava Andrea J. Goldsmith Mert Pilanci

Published in: CoRR (2024)

Keyphrases