Entropy-SGD: Biasing Gradient Descent Into Wide Valleys.

Pratik Chaudhari Anna Choromanska Stefano Soatto Yann LeCun Carlo Baldassi Christian Borgs Jennifer T. Chayes Levent Sagun Riccardo Zecchina

Published in: CoRR (2016)