Libra: In-network Gradient Aggregation for Speeding up Distributed Sparse Deep Training.

Heng Pan Penglai Cui Zhenyu Li Ru Jia Penghao Zhang Leilei Zhang Ye Yang Jiahao Wu Jianbo Dong Zheng Cao Qiang Li Hongqiang Harry Liu Laurent Mathy Gaogang Xie

Published in: CoRR (2022)