LoftQ: LoRA-Fine-Tuning-aware Quantization for Large Language Models.

Yixiao Li Yifan Yu Chen Liang Nikos Karampatziakis Pengcheng He Weizhu Chen Tuo Zhao

Published in: ICLR (2024)

Keyphrases