TensorFlow2 class2: 数据网络优化

TensorFlow2 notebook: Class2 神经网络的优化方法, 学习率,激活函数,损失函数和正则化的使用, 用Python语言写出5种反向传播优化器(SGD, Momentum, Adagrad, RMSProp, Adam).

In summary

非线性函数
大大提升列模型的表达力
优秀的激活函数特征
- 非线性, 多层神经网络可逼近所有函数
- 可微性, 优化器大多用梯度下降更新参数
- 单调性, 保证单层网络的损失函数是凸函数
- 近似恒等性: f(x)≈x, 神经网络更稳定

Sigmoid函数

1
2
3
4
5
6
7


tf.nn. sigmoid(x)
Tanh函数
tf.math. tanh(x)
Relu函数,对于初学者首选该函数
tf.nn.relu(x)
Leaky Relu函数
tf.nn.leaky_relu(x)

NN 优化的终极, 重点目标, 使得loss最小

1

loss_mse = tf.reduce_mean()

优化器
- 引导神经网络更新参数的工具
待优化参数𝒘, 损失函数loss, 学习率𝒍r, 每次迭代一个batch(2^n), t表示当前batch迭代的总次数.
- 一阶动量:与梯度相关的函数
- 二阶动量:与梯度平方相关的函数
优化器
- SGD(无momentum), 常用的梯度下降法
- SGDM(含momentum的SGD), 在SGD基础上增加一阶动量
- Adagrad，在SGD基础上增加二阶动量
- RMSProp，SGD基础上增加二阶动量
- Adam, 同时结合SGDM一阶动量和RMSProp二阶动量

Attach is the file of TensorFlow2class2.ipynb, or view it via the link.

Show me the code