欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 财经 > 金融 > 深度学习基础知识总结

深度学习基础知识总结

2025/6/13 20:53:28 来源:https://blog.csdn.net/gbz3300255/article/details/148552339  浏览:    关键词:深度学习基础知识总结

1.BatchNorm2d

加速收敛:Batch Normalization 可以使每层的输入保持较稳定的分布(接近标准正态分布),减少梯度更新时的震荡问题,从而加快模型训练速度。
减轻过拟合:批归一化引入了轻微的正则化效果,因为它依赖于 mini-batch 中的统计信息,这种方式可以减少对单个样本的过度拟合。
提高模型性能:在训练过程中,Batch Normalization 通过动态调整激活值的分布,让模型更容易适应数据,减少了对权重初始化的敏感性。


2. SELayer 是一种 通道注意力机制

旨在让模型学会“关注哪些通道重要”,从而获得更高的性能。
通常在卷积神经网络(CNN)中使用,增强特征表达能力。
例如,一张图片经过卷积后,每个通道可能代表某些特定的特征(比如颜色、边缘等),SELayer 会告诉网络“哪些通道更重要”。

3.卷积核和输出通道数的关系


在 2D 卷积 (nn.Conv2d) 中:输入通道数 (in_channels) 决定每个卷积核的深度。
输出通道数 (out_channels) 决定有多少个卷积核(即生成多少个输出通道)。
每个卷积核都会与所有输入通道进行卷积计算,然后汇总(例如通过加权求和的方式)生成一个对应的 输出通道。
 

4.激活函数:

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词