参考链接:https://blog.csdn.net/weixin_35848967/article/details/108493217
出发点:
因为我们的目标优化函数可能是多峰的(如下图所示),除了全局最优解之外还有多个局部最优解,在训练时梯度下降算法可能陷入局部最小值,此时可以通过突然提高学习率,来“跳出”局部最小值并找到通向全局最小值的路径。这种方式称为带重启的随机梯度下降方法。如下图所示:
标签:全局,退火,局部,余弦,最小值,梯度,所示,最优,衰减
来源: https://www.cnblogs.com/zf-blog/p/14110055.html