“渐变是什么,为什么它们会爆炸?”
“渐变色在时尚界的魅力,为何令人难以抵挡?”
通过阅读本文,您将对深度学习中最重要的概念有一个坚实的理解

梯度可以说是机器学习中最重要的基本概念。在本文中,我们将探讨梯度的概念,梯度消失和梯度爆炸的原因,以及如何控制梯度。
本文对谁有用?初级到中级的数据科学家。我将包含一些数学参考,这对于高级读者可能会有用。
从本文中您将得到什么?对梯度的深入概念理解,梯度与机器学习的关系,梯度带来的问题以及应对这些问题的方法。
目录
点击链接导航到具体章节
1) 什么是梯度?2) 实际梯度(数学上)3) 简单模型中的梯度(示例)4) 什么是梯度爆炸和梯度消失?5) 为什么梯度爆炸和梯度消失是个问题?6) 如何解决梯度爆炸和梯度消失问题?
什么是梯度?
想象一下,您有一个具有山和谷的表面。这个表面是由一些多维函数(具有多个输入的函数)定义的。
"""为了演示目的,制作一个具有山和谷的3D表面"""import matplotlib.pyplot as plt from matplotlib import cmfrom matplotlib.ticker import LinearLocatorimport numpy as np#创建宽的图例fig, ax = plt.subplots(subplot_kw={"projection": "3d"})# 生成数据.X = np.arange(-5, 5, 0.25)Y = np.arange(-5, 5, 0.25)X, Y = np.meshgrid(X, Y)R = np.sqrt(X**2 + Y**2)Z = 0.2*np.sin(X+Y + R) - 1*np.sin(X/2)# 绘制表面.surf = ax.plot_surface(X, Y, Z, cmap=cm.viridis, linewidth=0, antialiased=False)plt.show()
对于表面上的任意给定点,梯度告诉您,既告诉您到达表面上较高点的方向,也告诉您该点的表面有多陡峭。