GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection.

Jiawei Zhao Zhenyu Zhang Beidi Chen Zhangyang Wang Anima Anandkumar Yuandong Tian

Published in: CoRR (2024)

Keyphrases