资源网站搭建重庆网址大全

web/2025/9/26 19:32:29/文章来源:
资源网站搭建,重庆网址大全,邯郸网站建设taigew,wordpress 在safari运动很慢文章目录1. 训练#xff0c;验证#xff0c;测试集2. 偏差#xff0c;方差3. 机器学习基础4. 正则化5. 为什么正则化预防过拟合6. dropout#xff08;随机失活#xff09;正则化7. 理解 dropout8. 其他正则化9. 归一化输入10. 梯度消失 / 梯度爆炸11. 神经网络权重初始化1… 文章目录1. 训练验证测试集2. 偏差方差3. 机器学习基础4. 正则化5. 为什么正则化预防过拟合6. dropout随机失活正则化7. 理解 dropout8. 其他正则化9. 归一化输入10. 梯度消失 / 梯度爆炸11. 神经网络权重初始化12. 梯度的数值逼近13. 梯度检验14. 梯度检验的注意事项作业参考 吴恩达视频课 深度学习笔记 1. 训练验证测试集 深度学习是一个典型的迭代过程迭代的效率很关键 创建高质量的训练数据集验证集和测试集有助于提高循环效率 切分标准 小数据量时代常见做法是三七分70%验证集30%测试集也可以 60%训练20%验证和20%测试集来划分。 大数据时代数据量可能是百万级别验证集和测试集占总量的比例会趋于变得更小。 我们的目的就是验证不同的算法检验哪种算法更有效不需要拿出20%的数据作为验证集很少的一部分占比的数据就已经足够多了。数据来源 最好要确保 验证集 和 测试集 的数据来自同一分布因为要用验证集来评估不同的模型如果验证集和测试集来自同一个分布就会很好 2. 偏差方差 关键数据 训练集误差、验证集误差 如果最优误差贝叶斯误差人分辨的最优误差非常高比如15%。那么上面第二种分类器训练误差15%验证误差16%15%的错误率对训练集来说也是非常合理的偏差不高方差也非常低。 以上基于假设基本误差很小训练集和验证集 来自相同分布 根据这两个指标更好的优化算法。 3. 机器学习基础 4. 正则化 正则化有助于防止过拟合降低方差 范数norm 几种范数的简单介绍 L1 范数∣∣X∣∣1∑i1n∣xi∣||X||_1 \sum\limits_{i1}^n |x_i|∣∣X∣∣1​i1∑n​∣xi​∣ 表示非零元素的绝对值之和L2 范数∣∣X∣∣2∑i1nxi2||X||_2 \sqrt{\sum\limits_{i1}^n {x_i}^2}∣∣X∣∣2​i1∑n​xi​2​ 表示元素的平方和再开方 矩阵的范数叫做弗罗贝尼乌斯范数所有元素的平方和 ∣∣W∣∣F2||W||_F^{2}∣∣W∣∣F2​ 加上 L2 正则化 的损失函数 J(ω,b)1m∑i1mL(y^(i),y(i))λ2m∥ω∥22J(\omega, b)\frac{1}{m} \sum_{i1}^{m} \mathcal L \left(\hat{y}^{(i)}, y^{(i)}\right)\frac{\lambda}{2 m}\|\omega\|_{2}^{2}J(ω,b)m1​i1∑m​L(y^​(i),y(i))2mλ​∥ω∥22​ L1 正则权重 w 最终变得稀疏多数变成 0L2 正则使得权重衰减 W[l](1−αλm)∗W[l]−α(梯度)W^{[l]} (1-\frac{\alpha\lambda}{m})*W^{[l]} - \alpha(梯度)W[l](1−mαλ​)∗W[l]−α(梯度) 权重不但减少了还乘以了小于1的系数进行衰减 5. 为什么正则化预防过拟合 J(ω,b)1m∑i1mL(y^(i),y(i))λ2m∥ω∥22J(\omega, b)\frac{1}{m} \sum_{i1}^{m} \mathcal L \left(\hat{y}^{(i)}, y^{(i)}\right)\frac{\lambda}{2 m}\|\omega\|_{2}^{2}J(ω,b)m1​i1∑m​L(y^​(i),y(i))2mλ​∥ω∥22​ 当 λ\lambdaλ 设置的很大的时候最终 WWW 会变得很接近于 0神经网络中的很多单元的作用变得很小整个网络越来越接近逻辑回归 λ\lambdaλ 增大时整个神经网络会计算离线性函数近的值这个线性函数非常简单不是复杂的高度非线性函数不会发生过拟合 L2 正则化是 训练深度学习模型时最常用的一种方法 6. dropout随机失活正则化 以上是一个样本的过程其他样本也是同样的过程。 实施 dropout 举例最常用的方法 - inverted dropout反向随机失活 用一个三层网络举例 定义向量 ddd d[3]d^{[3]}d[3] 表示一个三层的 dropout 向量 d3 np.random.rand(a3.shape[0],a3.shape[1])对于元素小于 keep-prob 的对应为 0其概率为 1 - keep_prob获取激活函数 a[3]a^{[3]}a[3], a3 np.multiply(a3, d3)使得 d[3]d^{[3]}d[3] 中为 0 的元素把 a[3]a^{[3]}a[3] 对应元素归零向外扩展 a[3]a^{[3]}a[3]a3 / keep_prob 反向随机失活inverted dropout方法通过除以keep-prob确保 a[3]a^{[3]}a[3] 的期望值不变 7. 理解 dropout 其功能类似于 L2 正则化对于参数集多的层可以使用较低的 keep-prob 值不同的层可以使用不同的值缺点是需要交叉验证更多的参数 dropout 一大缺点就是代价函数不再被明确定义每次迭代都会随机移除一些节点想检查梯度下降的性能实际上是很难进行复查的 可以先关闭dropout将keep-prob 设置为 1确保 J 函数单调递减然后再尝试打开dropout 8. 其他正则化 数据扩增假如是图片数据扩增数据代价高我们可以 水平翻转随意剪裁旋转放大这种方式扩增数据进而正则化数据集减少过拟合成本很低 对于数字识别图片我们可以进行旋转扭曲来扩增数据集 early stopping 在验证集误差变坏的时候提早停止训练 early stopping 缺点不能同时处理 过拟合 和 代价函数不够小的问题 提早停止可能代价函数 J 不够小不提早结束可能会过拟合 不使用 early stopping 那么使用 L2 正则这样训练时间可能很长参数搜索空间大计算代价很高 early stopping 优点只运行一次梯度下降可以找出 w 的较小值中间值较大值无需尝试 L2 正则化超参数 λ\lambdaλ 的很多值 9. 归一化输入 归一化输入可以加速训练 零均值所有的数据减去均值归一化方差所有数据除以方差 注意μ,σ2\mu, \sigma^2μ,σ2 是由训练集得到然后用于其他所有数据集 10. 梯度消失 / 梯度爆炸 在非常深的神经网络中权重只要不等于 1激活函数将会呈指数级递增或者递减导致训练难度上升尤其是梯度与 L 相差指数级梯度下降算法的步长会非常非常小学习时间很长。 11. 神经网络权重初始化 上面讲到了梯度消失/爆炸如何缓解这个问题 为了预防 z 的值 过大 或 过小n 越大时你希望 wi 越小合理的方法是 wi1/nw_i 1/nwi​1/nn 是输入特征数量 w[l]np.random.randn(shape)∗np.sqrt(1n[l−1])w^{[l]} np.random.randn(shape)*np.sqrt(\frac{1}{n^{[l-1]}})w[l]np.random.randn(shape)∗np.sqrt(n[l−1]1​)n[l−1]n^{[l-1]}n[l−1] 是给第 lll 层输入的特征数量 如果使用ReLu激活函数最常用∗np.sqrt(2n[l−1])*np.sqrt(\frac{2}{n^{[l-1]}})∗np.sqrt(n[l−1]2​)如果使用tanh激活函数1n[l−1]\sqrt \frac{1}{n^{[l-1]}}n[l−1]1​​或者 2n[l−1]n[l]\sqrt \frac{2}{n^{[l-1]}n^{[l]}}n[l−1]n[l]2​​ 这样设置的权重矩阵既不会增长过快也不会太快下降到 0 从而训练出一个权重或梯度不会增长或消失过快的深度网络 我们在训练深度网络时这也是一个加快训练速度的技巧 12. 梯度的数值逼近 在反向传播时有个测试叫做梯度检验 我们使用双边误差 f′(θ)f(θε)−f(θ−ε)2ε\left.f^{\prime}( \theta\right)\frac{f(\theta\varepsilon)-f(\theta-\varepsilon)}{2 \varepsilon}f′(θ)2εf(θε)−f(θ−ε)​ 不使用单边误差因为前者更准确。 13. 梯度检验 梯度检验帮助我们发现反向传播中的 bug dθapprox [i]J(θ1,θ2,…θiε,…)−J(θ1,θ2,…θi−ε,…)2εd \theta_{\text {approx }}[i]\frac{J\left(\theta_{1}, \theta_{2}, \ldots \theta_{i}\varepsilon, \ldots\right)-J\left(\theta_{1}, \theta_{2}, \ldots \theta_{i}-\varepsilon, \ldots\right)}{2 \varepsilon}dθapprox ​[i]2εJ(θ1​,θ2​,…θi​ε,…)−J(θ1​,θ2​,…θi​−ε,…)​ dθ[i]∂J∂θid \theta[i]\frac{\partial J}{\partial \theta_{i}}dθ[i]∂θi​∂J​ 检验 dθapprox [i]≈dθ[i]d \theta_{\text {approx }}[i] \approx d \theta[i]dθapprox ​[i]≈dθ[i] ∥dθapprox −dθ∥2∥dθapprox ∥2∣∣dθ∣∣2\frac{\left\|d \theta_{\text {approx }}-d \theta\right\|_{2}}{ \left\|d \theta_{\text {approx }}\right\|_{2}||d \theta||_2}∥dθapprox ​∥2​∣∣dθ∣∣2​∥dθapprox ​−dθ∥2​​ 检查上式的值是否 10−7 10^{-7}10−7 14. 梯度检验的注意事项 不要在训练中使用梯度检验它只用于调试如果算法的梯度检验失败要检查所有项检查每一项并试着找出bug如果使用了正则化计算梯度的时候也要包括正则项梯度检验不能与dropout同时使用可以关闭dropout进行梯度检验检验正确了再打开dropout 作业 02.改善深层神经网络超参数调试、正则化以及优化 W1.深度学习的实践层面作业初始化正则化梯度检验 我的CSDN博客地址 https://michael.blog.csdn.net/ 长按或扫码关注我的公众号Michael阿明一起加油、一起学习进步

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/82350.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站诊断案例能自己做二次元人物的网站

文章目录 表级锁和行级锁了解吗?有什么区别?行级锁使用有什么注意事项?InnoDB有哪几类行锁?共享锁和排他锁是什么?意向锁有什么用? 锁是一种常见的并发事务的控制方式 表级锁和行级锁了解吗?有什…

查 网站接入服务提供者名称大冶市城乡建设局网站

Adobe After Effects是一款专业级别的视觉效果和动态图形处理软件,由Adobe Systems开发。它被广泛用于电影、电视节目、广告和其他多媒体项目的制作。 After Effects提供了强大的合成和特效功能,可以让用户创建出令人惊艳的动态图形和视觉效果。用户可以…

天津建设网网站打不开网站建设和建议

本文主要是介绍python图形界面上的按键与实际功能的对接,其实编程掌握了基础之后的学习应该都是靠自己去挖掘其他的在网上发现多半教程都是2的,故本文使用的是python3.5,其实也没什么区别,就有一些支持库改变而已首先我们使用pyth…

潍坊公司网站制作网络平台推广广告费用

近期使用加密狗对软件进行加密,但是软件用的c#,这就比较坑了,因为c#自带的System.Security.Cryptography只支持c#格式的公钥加密私钥解密,而现在需要私钥加密公钥解密。于是网上进行资料查找,一堆资料说的都是使用Boun…

广州定制型网站建设建个商场网站

Sqoop是一个用于在Hadoop和关系型数据库之间传输数据的开源工具。它可以将结构化数据从关系型数据库(如MySQL、Oracle、SQL Server等)导入到Hadoop的分布式文件系统(HDFS)或hive中,并且可以将数据从HDFS、hive导出到关…

国内最好的网站建设cdr 做网站

文章目录 0 前言1 基于YOLO的火焰检测与识别2 课题背景3 卷积神经网络3.1 卷积层3.2 池化层3.3 激活函数:3.4 全连接层3.5 使用tensorflow中keras模块实现卷积神经网络 4 YOLOV54.1 网络架构图4.2 输入端4.3 基准网络4.4 Neck网络4.5 Head输出层 5 数据集准备5.1 数…

做ae动图的网站中秋节网页设计素材

分享一种开发中遇到的比较方便的表格高度自适应方案 template代码 <div class"page"><div class"table_wrap"><el-table></el-table></div> </div>css代码 将el-table设置为绝对定位&#xff0c;相对于父元素定位且…

建设部住房城乡建设厅网站我国大宗商品交易所

课程地址和说明 线性代数实现p4 本系列文章是我学习李沐老师深度学习系列课程的学习笔记&#xff0c;可能会对李沐老师上课没讲到的进行补充。 本节是第二篇 矩阵计算 矩阵的导数运算 此处参考了视频&#xff1a;矩阵的导数运算 为了方便看出区别&#xff0c;我将所有的向量…

开一个网站建设公司需要什么网站建设后台实训体会

笔记目录 渗透测试工具(1)wireshark渗透测试工具(2)Nmap渗透测试工具(3)BurpsuiteAWD比赛(1)AWD入门攻略大纲 1.工具简介 (1)定义 ①功能 网络扫描和嗅探工具包&#xff0c;三个主要基本功能&#xff1a; 探测一组主机是否在线 扫描主机端口、嗅探所提供的网络服务 推断出主…

微信公众号要钱吗自动优化网站建设咨询

了解数据结构的人应该都听说过哈希表这种数据结构&#xff0c;它是一种典型的利用键值对存储并检索数据的一种非线性结构&#xff0c;又称散列表或杂凑法。在一般的线性表结构中&#xff0c;数据的相对位置是随机的&#xff0c;即数据和用于检索的关键字之间不存在确定的关系&a…

一站式企业服务北京网站开发制作公司

昨日任务  对于关于我界面的 关于我们 的界面。今日任务完成功能介绍界面以及转换&#xff0c;并且在功能介绍界面增加特效&#xff0c;获取本机的时间&#xff0c;年月日星期几小时分钟 秒&#xff0c;可以看时间。明日任务完成联系我们的功能。困难在增加特效功能中一直获…

网站建设工单系统宣传片制作标准参数

FreeRTOS学习笔记——四、任务的定义与任务切换的实现 0 前言1 什么是任务2 创建任务2.1 定义任务栈2.2 定义任务函数2.3 定义任务控制块2.4 实现任务创建函数2.4.1 任务创建函数 —— xTaskCreateStatic()函数2.4.2 创建新任务——prvInitialiseNewTask()函数2.4.3 初始化任务…

浙江建设职业技术学院招生网站重庆装修公司口碑排名

在博客文章JAXB和Log4j XML配置文件中 &#xff0c;我讨论了“与使用JAXB通过Java类处理[Log4j 1.x和Log4j 2.x] XML配置文件相关的细微差别。” 在本文中&#xff0c;我将探讨另一个与通过Log4j 2.x XML Schema文件Log4j-config.xsd生成的JAXB对象生成Log4j 2.x配置XML相关的挑…

电商学习网站洛阳市做网站的

CORS 全称是跨域资源共享&#xff08;Cross-Origin Resource Sharing&#xff09;&#xff0c;是一种 AJAX 跨域请求资源的方式&#xff0c;支持现代浏览器&#xff0c;IE支持10以上。 CORS与JSONP的使用目的相同&#xff0c;但是比JSONP更强大。JSONP只支持GET请求&#xff0c…

电子相册在线制作网站萍乡专业的企业网站建设公司

C语言一维数组的定义一般形式类型符 数组名[常量表达式]C语言使用一维数组注意事项数组名的命名规则和变量名相同&#xff0c;遵循标识符命名规则。在定义数组时&#xff0c;需要指定数组中元素的个数&#xff0c;方括号中的常量表达式用来表示元素的个数&#xff0c;即数组长度…

办公内网网站建设标准医院网站云服务器配置

展开全部1、问62616964757a686964616fe4b893e5b19e31333433633530题主要是类型的问题。因为a 是int型的&#xff0c;在计算的时候不转型成浮点型是不对的(1/a0)因此要写成&#xff1a;pipi1.0/(2*a-1);pipi-1.0/(2*a-1);还有判断条件&#xff1a;while ((1.0/a)>1e-4);另外&…

建设电子商务网站考核试卷网站建设可以学吗

k8s 实战 常见异常事件 event 及解决方案分享 集群相关 Coredns容器或local-dns容器 重启集群中的coredns组件发生重启(重新创建)&#xff0c;一般是由于coredns组件压力较大导致oom&#xff0c;请检查业务是否异常&#xff0c;是否存在应用容器无法解析域名的异常。如果是l…

网站后台统计怎么启动啊qq网页版登陆

文章目录 前言一、ZC序列是什么&#xff1f;二、创建自定义的 C OOT 块1、创建 OOT 模块2、创建 OOT 块3、修改 C 文件4、编译及安装 OOT 块 三、测试1、grc 图2、运行结果①、时域图②、时域幅值模图③、IQ 曲线 四、其他五、资源自取 前言 本文实现在 GNU Radio 中创建 Zado…

电子技术支持 东莞网站建设专业的企业智能建站价格便宜

目录 传统下网络服务模型 事件监听模型 NIO核心概念 单线程Reactor模式 多线程Reactor模式 Kafka 的网络设计 主要概念 类比思维理解 参考文章 传统下网络服务模型 线程太多无法处理大规模请求 事件监听模型 NIO核心概念 nio是实现reactor模式的底层API代码 单…

番禺网站设计公司花蝴蝶免费视频直播高清版

分享一下在Django中使用uploadify——一个jQuery批量上传插件——的方法。github上的django-uploadify使用的是2.1.4版本&#xff0c;上传button只能使用图片&#xff0c;不能很方便的修改样式。本文针对的是uploadify 3.0.0版本。uploadify可以结合Django自身的ImageField&…