小白版深度学习-0:前置知识 一元函数 导数 偏导 激活函数 矩阵运算

以下知识只需要高中数学知识即可看懂!
此前置知识不断更新

一元函数

f(x)=wx+b
x为未知数,,也称作“元”

导数

即高中数学中的导数,此处不做多余赘述。

偏导

即高中数学中的偏导,此处不做过多赘述。

激活函数

该函数与一般函数并无什么不同,不要被其名字吓到,请把它在此当作一个普通的函数看待,至于为什么需要激活函?在讲到神经网络时将会对此进行讲解。
以下列出几种激活函数

sigmoid函数

其函数表达式与其导数的形式如下
image.png
其图像如下:
image.png
从图像我们可以很清晰的看出,该函数图像近似于翻转的“Z”,在绝大多数的负数部分,其值趋近于0,在绝大多的正数部分,其值趋向于1。

tanh函数

函数形式及其导数
image.png
函数图像:
image.png
与sigmoid非常相似

ReLu函数

函数形式:
image.png
可知其x<0时导数为0,x>0导数为1,图像如下:
image.png

以上为三种常用的激活函数。

矩阵运算

此处只介绍三种运算,即矩阵乘法、矩阵加法、矩阵的转置,如果你不知道什么叫做矩阵,请复习高中数学“矩阵”。

矩阵加法

只有两个矩阵为同型矩阵时,才能进行加法运算,何为同型矩阵?即两个矩阵行数相同、列数相同。
矩阵加法示例如下图,即对应位置相加,矩阵减法与加法原则一致。
image.png

矩阵转置

将原矩阵的行和列对调,行变成列,列变成行,即为矩阵的转置,示例如下图,存在矩阵A,其转置矩阵为$A^T$,:
image.png

矩阵乘法

本处本人手写一个简单例子,如下图,存在一个矩阵A,大小为3x3,即3行3列,存在一个矩阵B,大小为3x2,即3行2列。
我们可以直接看第三行的结果,我们可以看见矩阵Ax矩阵B,获得的是一个3x2的矩阵。
所以我们计算矩阵乘法的第一步:确定结果的大小,一般地,对于大小为MxN地矩阵A,大小为NxK地矩阵B,AxB的大小为MxK,即大小为A的行数B的列数。仔细观察可知A的列数和B的行数相等,这也引出了矩阵乘法的一个条件:A的列数=B的行数,当不满足这个条件时,无法进行矩阵的乘法运算。进而我们也可以得出AxB不等于BxA,矩阵乘法不满足交换律。
观察第四行,我已给出了结果的每个元素位置,例如“1行2列”,我们可以通过这种方式来记住怎么计算乘法,“1行2列”中的1行我们可以通俗的认为其表示A矩阵的第1行,2列表示B矩阵的第2列,“1行2列”表示A矩阵第一行与B矩阵第二列对应元素相乘的累加和。
image.png
其通俗的计算公式如下:
image.png
各位置的简化公式如下(摘自百度百科):
image.png