稀疏自动编码之神经网络

首页 > 代码库 > 稀疏自动编码之神经网络

稀疏自动编码之神经网络

2024-07-26 13:51:38 220人阅读

考虑一个监督学习问题，现在有一些带标签的训练样本(x⁽ⁱ⁾,y⁽ⁱ⁾).神经网络就是定义一个复杂且非线性的假设h_W,b(x)，其中 $W, b 是需要拟合的参数.$

$下面是一个最简单的神经网络结构，只含有一个神经元，后面就用下图的形式代表一个神经元：$

把神经元看作是一个计算单元，左边的 $\textstyle h_{W,b}(x) = f(W^Tx) = f(\sum_{i=1}^3 W_{i}x_i +b)$

$f(z) = \frac{1}{1+\exp(-z)}.$

还有一种激活函数是正切函数（tanh function）:

$f(z) = \tanh(z) = \frac{e^z - e^{-z}}{e^z + e^{-z}},$

下面是两种激活函数图像：

$tanh(z)函数式sigmoid函数的变体，它的输出范围是[-1,1]，而不是[ 0,1].$

$注意一个对后后面推导有用的等式：$

$对于sigmoid函数 f (z) = 1 / (1 + exp( - z))，它的导函数为 f ‘(z) = f (z)(1 - f (z)).$

$神经网络模型$

$神经网络就是把许多神经元连接到一起，使得一个神经元的输出作为另一个神经元的输入。下面是一个小规模的神经网络：$

图中同样用圆圈表示神经网络的输入（蓝色的圆圈表示整个网络的输入，红色圆圈表示神经元），截距项为+1，但是这里称为偏置节点。网络的最左边的一层叫做输入层，最右边的一层叫做输出层（输出层可以有很多神经元节点，这个例子只有一个节点）。中间的一层称为隐层，因为它们的值在训练集中观察不到。可以说图中神经网络有3个输入节点（不包括偏置节点），3个隐层节点，1个输出节点。

用 $L_{n_l}$

$a^{(l)}_i$

$\begin{align}a_1^{(2)} &= f(W_{11}^{(1)}x_1 + W_{12}^{(1)} x_2 + W_{13}^{(1)} x_3 + b_1^{(1)}) \a_2^{(2)} &= f(W_{21}^{(1)}x_1 + W_{22}^{(1)} x_2 + W_{23}^{(1)} x_3 + b_2^{(1)}) \a_3^{(2)} &= f(W_{31}^{(1)}x_1 + W_{32}^{(1)} x_2 + W_{33}^{(1)} x_3 + b_3^{(1)}) \h_{W,b}(x) &= a_1^{(3)} = f(W_{11}^{(2)}a_1^{(2)} + W_{12}^{(2)} a_2^{(2)} + W_{13}^{(2)} a_3^{(2)} + b_1^{(2)}) \end{align}$

$z^{(l)}_i$

$\textstyle z_i^{(2)} = \sum_{j=1}^n W^{(1)}_{ij} x_j + b^{(1)}_i$

$于是上面计算过程的表示就可以更简洁地写为：$

$\begin{align}z^{(2)} &= W^{(1)} x + b^{(1)} \a^{(2)} &= f(z^{(2)}) \z^{(3)} &= W^{(2)} a^{(2)} + b^{(2)} \h_{W,b}(x) &= a^{(3)} = f(z^{(3)})\end{align}$

$称这个过程为前向传播（ forward propagation ）.$

$更为一般的是，用 a (1) = x 表示输入层的值，于是 l 层的激活值就是 a (l) ，计算 l + 1 层的激活值 a (l + 1) ：$

$\begin{align}z^{(l+1)} &= W^{(l)} a^{(l)} + b^{(l)} \a^{(l+1)} &= f(z^{(l+1)})\end{align}$

$把所有参数矩阵化，用矩阵—向量操作，可以利用线性代数的优势快速求解网络参数。$

$到目前为止，我们只关注了一个神经网络的例子，但是神经网络还有许多其它的结构（神经元之间的连接类型），包括多个隐层的神经网络。最常见的方式是，对于一个 n l 层的神经网络，第1层代表输入层， n l 层代表输出层，中间的每个 l 层与 l+ 1 层紧密相连。设置好以后，就可以像上述的前向反馈一样，逐层计算激活值，这就是一种前馈神经网络（ feedforward neural network），因为连接中没有回路或者闭环。$

$神经网络可以有多个输出节点。这里给出一个含有2个隐层和2个输出节点的网络：$

$y^{(i)} \in \Re^2$

$学习来源：http://deeplearning.stanford.edu/wiki/index.php/Neural_Networks$

稀疏自动编码之神经网络

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 稀疏自动编码之神经网络

稀疏自动编码之神经网络

看完仍有疑问？有类似问题直接问程序猿