开发者社区> GoAlaaa> 正文

《深度学习》李宏毅 -- task5网络技巧设计

简介: 局部最小值saddle point和鞍点local minima
+关注继续查看
福利推荐:阿里云、腾讯云、华为云等大品牌云产品全线2折优惠活动来袭,4核8G云服务器899元/3年,新老用户共享优惠,点击这里立即抢购>>>

一、梯度下降法的局限


局部最小值saddle point和鞍点local minima

优化(Optimization)损失函数失败的原因主要有2种:

1.局部最小值 (local minima),无路可走。

2.鞍点 (saddle point),还可以继续梯度下降。

image.png


最好先知道损失函数的形状,才能更好的解决上面的问题。


二、分批(Batch) 和动力(Momentum)


2.1 Batch

分批处理(Batch),也称为批处理脚本,是对某对象进行批量的处理,可以减少运算时间。

image.png


分批处理可以减少运行时间,快速达到目标。

image.png


每次分批训练有时优于一整批次训练,因为它可以快速找到目标。


三、分类


分类问题是得到一个一个的值,跟回归问题不一样。

image.png

通常会把数据进行归一化处理后再分类。


四、分批标准化


image.png


分批次训练模型时,若某批次数据很小,乘以一个大底系数,变化量也是很小的,若某批次数据很大,即使乘以一个非常小的参数,数据变化也是很大的,那么在一起训练时不好处理,所以先将数据标准化,那么数据就没有什么差异。


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
使用numpy手写深度学习DNN网络
使用numpy手写深度学习DNN网络
22 0
基于DNN深度学习网络的OFDM信号检测算法的matlab仿真,对比LS和MMSE两个算法
基于DNN深度学习网络的OFDM信号检测算法的matlab仿真,对比LS和MMSE两个算法
63 0
一种使用无线传感器网络预测圆形区域入侵检测的 k 屏障数量的深度学习方法附matlab代码
一种使用无线传感器网络预测圆形区域入侵检测的 k 屏障数量的深度学习方法附matlab代码
24 0
《深度学习论文实现:空间变换网络-第一部分》电子版地址
深度学习论文实现:空间变换网络-第一部分
16 0
受限波尔茨曼机RBM_DBN深度学习网络训练和测试matlab仿真,数据库为随机数矩阵
受限波尔茨曼机RBM_DBN深度学习网络训练和测试matlab仿真,数据库为随机数矩阵
69 0
简答:如何设计一个深度学习网络来实现帧内预测?
简答:如何设计一个深度学习网络来实现帧内预测?
54 0
机器学习之深度学习卷积神经网络,实现基于CNN网络的手写字体识别
机器学习之深度学习卷积神经网络,实现基于CNN网络的手写字体识别
78 0
深度学习目标检测网络轻量化研究现状
随着深度学习和计算机视觉的快速发展,各类基于卷积神经网络的目标检测算法不断地刷新标准检测数据集的最好性能成绩。目前主流的基于卷积神经网络的目标检测算法,包括各种两阶段检测器(RCNN,Fast RCNN,Faster RCNN,Mask RCNN,Trident Net)以及单阶段检测器(YOLO,SSD,Corner Net,Extreme Net)。尽管新算法不断刷新性能,但大多数目标检测算法其模型的参数动辄数十兆字节,在计算资源有限的移动终端等边缘设备中部署这样的大模型非常困难。因此,在保证一定准确率的前提下尽可能追求检测算法网络的轻量化具有重要的理论研究意义和应用价值。
595 0
深度学习教程 | 序列模型与RNN网络
本节介绍介绍循环神经网络(RNN)的重要知识,包括:循环神经网络RNN,语言模型,采样生成序列,RNN梯度消失与梯度爆炸,GRU(门控循环单元),LSTM(长短期记忆),双向与深度RNN等
3721 0
+关注
GoAlaaa
专注大数据与人工智能技术分享,个人博客:https://blog.csdn.net/qq_36816848
文章
问答
文章排行榜
最热
最新
相关电子书
更多
深度学习框架实战-Tensorflow
立即下载
TensorRT Introduction
立即下载
端上智能-深度学习模型压缩与加速
立即下载


http://www.vxiaotou.com