Scale out for large minibatch SGD: Residual network training on ImageNet-1K with improved accuracy and reduced time to train.

Published in: CoRR (2017)

Keyphrases