深度学习-梯度下降算法-NLP(五)

2026/5/24 12:13:25 来源：https://blog.csdn.net/m0_64531791/article/details/140211587 浏览: 次关键词：深度学习-梯度下降算法-NLP(五)

梯度下降算法

深度学习中梯度下降算法简介
- 找极小值问题
- - 数学上求最小值
  - 梯度
  - 梯度下降算法
- 找极小值问题在深度学习流程中
- - 深度学习整体流程图
  - 求解损失函数的目标
  - 权重的更新

深度学习中梯度下降算法简介

找极小值问题

引子： 我们训练一个人工智能模型，简单点说，就是根据数据，调整模型的参数，使模型预测的值和我们数据的值一样。但一开始肯定不一样，所以我们引入损失函数，用它来计算，还差多少；差多少我们求出来，我们怎么调整原有模型里面的参数呢？

哎！调整原有模型的参数目的就是为了使得预测的值和要求值一样嘛，是不是求一个模型参数可以使得计算出的预测值和要求值之间的差距最小呢？===》这就是找极小值问题

所以本质上就是求损失函数的极小值。

数学上求最小值

在这里插入图片描述
拆解示意：
目标： 找到合适的x值，使得f(x)最小。
逻辑

1.任取一点x0，计算在这一点的导数值f(x0)
2.根据导数的正负，决定x0应当调大还是调小；导数为正，那么就调小x；因为增大，y也会增大；导数为负，增大x
3.迭代进行1,2步直到导数为0；或者导数变号了。
什么情况下导数为变号？
那就函数的值，之前在减小，现在在增大了，所以导数就会编号，那么最小值就在其中（救赎之道，就在其中）