批量归一化（Batch Normalization）-爱伦尔生活百科

批量归一化（Batch Normalization） 是一种用于加速深度神经网络训练并提高模型稳定性的技术，通常简称为 BatchNorm。它通过在每一层网络的激活输出上应用归一化操作来减少内部协变量偏移（Internal Covariate Shift），即减小网络在训练过程中因参数变化导致的分布漂移。批量归一化可以使网络更快地收敛，并帮助模型在训练时更稳定。

批量归一化的工作原理：

批量归一化（Batch Normalization）

对于每一层网络的输出（通常是一个 mini-batch），批量归一化会将其均值和方差调整到标准正态分布（均值为0，方差为1）。具体步骤如下：

计算均值和方差：对 mini-batch 中的每个样本，计算其均值和方差。
归一化：将每个样本减去均值，再除以标准差，从而使数据的分布在该 mini-batch 中变成均值为0，方差为1。
缩放和平移：引入两个可学习的参数，缩放系数（gamma）和偏移系数（beta），用于恢复模型的表示能力。这一步允许网络在需要时重新调整归一化后的分布，以便更好地适应任务需求。

批量归一化的优势：

提高训练速度：通过减少内部协变量偏移，网络在训练过程中收敛得更快。
稳定训练过程：批量归一化有助于减小梯度消失或爆炸的风险，使网络在较大的学习率下也能稳定训练。
一定程度的正则化效果：批量归一化对每一批数据应用不同的归一化，因此引入了随机性，具有一定的正则化效果，从而减少过拟合的风险。

批量归一化在卷积神经网络（CNN）和循环神经网络（RNN）中应用广泛。通过在网络层的激活输出上进行批量归一化，深度学习模型能够在更少的训练时间内达到更好的效果。

其实怎么理解呢，如果每一层的输出都是一个不同的分布，那么训练的时候就很难收敛，我们需要将每次的输出都整理为相似的输出，有助于收敛和训练。

假设一个批量数据集中的样本为 ( x_1, x_2, \ldots, x_n )，其均值和方差分别为：

均值：
μ = 1 n ∑ i = 1 n x i \mu = \frac{1}{n} \sum_{i=1}^{n} x_i μ=n1i=1∑nxi
方差：
σ 2 = 1 n ∑ i = 1 n ( x i − μ ) 2 \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2 σ2=n1i=1∑n(xi−μ)2

步骤 1：数据去均值

将每个样本减去均值 ( \mu )，得到新的样本 ( x_i’ = x_i - \mu )：

新数据的均值为0，因为：
均值 ( x i ′ ) = 1 n ∑ i = 1 n ( x i − μ ) = 1 n ( ∑ i = 1 n x i − n μ ) = 0 \text{均值}(x_i') = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu) = \frac{1}{n} \left(\sum_{i=1}^{n} x_i - n \mu\right) = 0 均值(xi′)=n1i=1∑n(xi−μ)=n1(i=1∑nxi−nμ)=0

步骤 2：数据除以标准差

再将去均值后的每个样本 ( x_i’ ) 除以标准差 ( \sigma )，得到 ( x_i’’ = \frac{x_i’}{\sigma} = \frac{x_i - \mu}{\sigma} )：

新数据的方差变为1，因为：
方差 ( x i ′ ′ ) = 1 n ∑ i = 1 n ( x i − μ σ ) 2 = 1 n ∑ i = 1 n ( x i − μ ) 2 σ 2 = σ 2 σ 2 = 1 \text{方差}(x_i'') = \frac{1}{n} \sum_{i=1}^{n} \left(\frac{x_i - \mu}{\sigma}\right)^2 = \frac{1}{n} \sum_{i=1}^{n} \frac{(x_i - \mu)^2}{\sigma^2} = \frac{\sigma^2}{\sigma^2} = 1 方差(xi′′)=n1i=1∑n(σxi−μ)2=n1i=1∑nσ2(xi−μ)2=σ2σ2=1

批量归一化（Batch Normalization）

批量归一化的工作原理：

批量归一化的优势：

步骤 1：数据去均值

步骤 2：数据除以标准差

热门文章

windows10环境变量在哪里？设置 windows10环境变量设置位置介绍

windows11怎么删除账户

windows10怎么开启卓越性能模式 windows10开启卓越性能模式方法介绍

重新开通空间具体方法

豆瓣删除动态教程

最新发布

盖世豪侠国语高清30集（盖世豪侠原著作者）

谷粒商城 - 个人笔记(基础篇二）

红队系列-网络安全知识锦囊(持续更新)

hexo史上最全搭建教程

WordPress一点优化企业主题模板制作教程

标签列表

批量归一化（Batch Normalization）

批量归一化的工作原理：

批量归一化的优势：

步骤 1：数据去均值

步骤 2：数据除以标准差

相关文章

热门文章

最新发布

标签列表