网站建设知名企业wordpress文章页添加小工具

news/2025/10/5 12:50:21/文章来源:
网站建设知名企业,wordpress文章页添加小工具,在网上做国际快递淘宝网站,邯郸学做网站学校说明#xff1a;本文是七月算法5月深度学习班第五次课听课笔记。黄色标注的部分为自己不太确定的部分。 训练 mini-batch SGD 神经网络使用mini-batch SGD训练得到最优权重。训练过程如下#xff1a;#xff08;以下参考了andrew ng的机器学习课程#xff09;例如训练样本…说明本文是七月算法5月深度学习班第五次课听课笔记。黄色标注的部分为自己不太确定的部分。 训练 mini-batch SGD 神经网络使用mini-batch SGD训练得到最优权重。训练过程如下以下参考了andrew ng的机器学习课程 例如训练样本量m3200mini-batch 每次取32张 for  i 1,33,65,... 从i 开始取32个图片样本 前向计算得到中间变量a  z 和 损失函数值 后向计算得到梯度 用这部分梯度更新权重 问为什么使用batch而不使用一张图片呢 答一张图片样本量不够容易发生振荡。如果是一张图片就是随机梯度下降了。  两种去均值方法 第一种减去图片每个像素的均值。在图片的每个像素位求均值。例如样本图片是[32,32,3]将会得到[32,32,3]数组的平均值。每个样本的不同像素减去对应位置的均值。AlexNet使用该方法。 第二种减去每个通道channel的均值。例如样本图片是[32,32,3]会得到3个平均值分别表示R、G、B的均值。每个样本不同通道的值减去对应的均值。VGGNet使用该方法。 再次强调CNN训练不需要做标准化、PCA和白化 权重初始化 SGD参数学习第一步就是权重初始化。权重初始化有多种方法。 al表示每层神经单元值。W1表示从第一层到第二层的权重 方法1  w0。不可以。所有权重初始化为0这会发生对称现象。例如a2g(a1*W1)。所有W10a2所有神经单元的值就都相同了。而神经网络的不同神经元是用来学习不同的知识点。这样就引起了对称性。不能好好工作了。 方法2 w0.01*np.random.rand(D,H).  初始化权重为一些小的随机数。在python实现中实现了权重正负数各一半。效果该方法在包含1-2个隐藏层的网络中是有效的。网络层数加深带来整个网络激活传递的不对称性(会引起数据在很小或者特别大的范围内变动也就是说方差趋于0或者无穷)。 实现使用10层网络500神经元观察 每一层 神经单元的 平均值 和方差。可以看到从第三层开始均值与方差几乎不发生变化接近0。方法3 wnp.random.rand(fan_in,fan_out). 说明fan_in 这一层输入元素的个数fan_out这一层输出元素的个数。效果会出现梯度为0的情况类似sigmoid函数出现的情况。 方法4 wnp.random.rand(fan_in,fan_out)/np.sqr(fan_in) 效果效果还不错可以使用。但是在使用ReLU激活函数的时候同样带来整个网络激活传递的不对称性。 方法5 wnp.random.rand(fan_in,fan_out)/np.sqr(fan_in/2)这是一篇在2015年的论文中提到的方法。可以解决ReLU时发生的问题。 Batch Normalization 对于权重可能引起网络激活的不对称性问题谷歌提出了一种解决方法Batch Normalization。思想是期望激励过后的神经元的值仍然能够保持高斯分布。问为什么是高斯分布呢答高斯分布简单方差可控。而且还满足了同一层神经元要有一定的差异性。问题BN放在什么问题Batch Normalization通常接在全连接之后激励层之前。全连接层是产生波动最大可能性的地方也是学习能力最强的地方。问题BN的具体操作求均值求方差xi(xi-均值)/np.sqr(方差e)最后一步做伸缩和平移且输出yigama * xibeta     。gama和beta是训练过程中可以获得的。之所以有最后一步是因为BN过程中对原始数据做了修改表达的信息会有部分丢失。通过伸缩平移尽量将信息还原。BN的优点是学习率设置高一点也可以对初始化数据依赖少了。开始训练 首先先用小数据集训练10个分类每个分类下10个样本测试训练模型是否OK。接着可以改变正则化从无到有。 需要监控的参数 1const function的值是不是振荡下降2 训练集上的准确率是否能到100%。 几个现象准确率低0.6cost function值不变有问题学习率太大了 训练集准确率交叉验证集准确率   过拟合试试调大正则化项 训练集准确率 约等于 交叉验证集准确率   如果都很高那模型不错可以使用。如果都很低0.6数据问题模型问题样本倾斜了 Dropout ---神经网络正则化 L2 正则化    l ... lamda*(权重和)    用于神经网络参数个数多计算量大。所以不是最好的选择。Dropout 语言描述1 别一次打开所有学习单元别让神经元记住那么多东西每次关掉一部分感知器得到新的模型最后融合。设置一个概率p允许通过的概率。在dropout层会有n*(1-p)个节点关闭神经单元的值为0。注意不是权重为0。由于训练的时候有一个概率在预测的时候同样需要概率。所以工业上一般是在训练过程中将输入数据xx*p。预测的时候就不需要再乘以p了。Caffe使用 主要模块 Blob 存储数据和梯度值Layer 传递层与层的输入输出Net   网络利用前向后向计算梯度Solver 用梯度更新权重使用过程 网上有很多资料讲使用过程这里不详细记录。1 Resize图片转存为LMDB/LevelDB格式。注意分类下表从0开始。2 定义网络结构3 定义solver训练参数4 训练模型库选择  model zoo 1 如果层次不变改变输入输出输入是 data层 data_param 和transform_param 参数段。输出是layer {  name: fc8  name 需要修改。2 如果添加/删除层次注意顺序。一般把前面层学习率调低从修改层开始调高学习率。一般fine-tuning的前期loss下降非常快中间有个瓶颈期要有耐心。3 在solver调整学习率1/10,1/100。利用snapshot 存储中间结果。如果发生宕机可以接着继续训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/928269.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025 年 AI 应用数据泄露防范:以“流式网关”为中枢的链路化治理与合规映射

2025 年 AI 应用数据泄露防范:以“流式网关”为中枢的链路化治理与合规映射AI 原生应用把“数据—模型—业务”三条链路深度耦合,泄露与越权从“点状事件”转为“链路型、低信号、渐进式”攻击:提示词注入→RAG 越权…

安装飞牛os出现452错误的解决方法

安装飞牛os出现452错误的解决方法最近尝试飞牛os系统,按照官网的安装教程,选择Graphical Install安装时出现452:out of range pointer错误。 最先尝试用ventoy做引导盘,能启动并进行安装,但却无法正常引导系统。 …

郑州春蕾网站建设仿站小工具下载

虚拟内存是一种对主存的抽象概念。 (1)将主存看作一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据,通过这种方式高效地使用内存 (2)为每…

高性能网站建设进阶...在线网站建设询问报价

摘要:偶然机会接触到python语音,感觉语法简单、功能强大,刚好朋友分享了一个网课《python 爬虫与数据可视化》,于是在工作与闲暇时间学习起来,并做如下课程笔记整理,整体大概分为4个部分(1.pyth…

已备案网站新增接入wordpress 文章空白页

本周重点 ①Linux系统提权 ②Linux权限维持 ③Windows 提权 ④Windows权限维持 ⑤SSRF利用 ⑥内网环境 ⑦内网扫描 ⑧漏洞利用 ⑨内网代理 ⑩获取主机控制权其他方案 ⑩①vuln靶场 ⑩②CS代理与ICMP隧道 本周主要内容 ①Linux系统提权 系统提权是成功入侵系统之…

Alexa进入自主时代:AI技术新突破

文章探讨了Alexa语音助手在人工智能领域的技术演进,重点介绍了自我感知、自主学习和自助服务三大技术方向,包括常识推理、多轮对话状态跟踪、少样本学习等核心技术突破,展示了AI系统向更自主化发展的技术路径。Alex…

淮北市住房和城乡建设局网站html5韩国网站模板

当在 Java 项目中使用 Redis 时,特别是在 Spring Boot 项目中使用 Redis,下面是一个详细的教程,涵盖了 Redis 的配置和使用。 在 Spring Boot 项目中配置和使用 Redis 步骤 1:添加 Redis 依赖 在你的 Spring Boot 项目的 pom.x…

铜仁市网站建设情况南京微网站开发

功能描述:开发一个类似于 Windows 命令行提示符或 Linux 命令行终端的应用程序 一、最终演示效果 QtCmd 不是因为它是 Qt 的组件,而是采用 Qt 开发了一个类似 Windows 命令提示符或者 Linux 命令行终端的应用程序,故取名为 QtCmd。 上述演示…

入门AJAX——XMLHttpRequest(Get) - 教程

入门AJAX——XMLHttpRequest(Get) - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

知识付费网站搭建微信营销的功能

前段时间,写程序时,出了错误,竟然没有想到是自己属性命名的问题,哎~~~真是一定要注意规范呀,在这里我从网上找了些,规范作为参考 Sun 推荐的命名规范 1 ,类名要首字母大写,后面的单词…

公司网站php天河网站建设哪家好

文章目录 1. TSP案例引入2. 考虑惰性约束的求解效率对比2.1 求解基础TSP模型2.2 基于SCIP的Conshdlr添加惰性约束1. TSP案例引入 在运筹学建模和求解过程中,“lazy constraints”(惰性约束)是一种动态添加约束的策略,松弛部分约束后求解得到的“可行解”,不断地进行可行性…

ROM和RAM

1.1计算机中有两种存储器 (1)内存:内存与CPU接轨比较紧密,内存可以被CPU直接访问,内存可按照字节单位来随机访问,程序运行时离不开内存,程序中的变量都是定义在内存中,内存受限于物理技术和成本,容量比较小而…

深入解析:C#学习26天:内存优化的几种方法

深入解析:C#学习26天:内存优化的几种方法pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

电子商务网站建设 代码学校诗歌网站建设

在存在缓存的情况下,删除较前的slide,会出现当前slide与后一个slide重复出现的情况 假设当前存在5个slide,且这5个slide已缓存,则删除slide2后,仍为5个slide,且slide2的内容变为slide3的内容,此…

老板合作网站开发网销怎么做

日常工作中经常需要确定各个指标的权重,利用熵值法确定权重属于客观赋权法,从数据出发,避免过强的主观性,但是也同时带来了一些问题。在某个论坛的帖子中,作者提出了这样的一个问题:“熵值法用于确定权重是…

整理数据制作 直方图,箱须图,概率密度估计(KDE)图

1.导入库和设置 import math import numpy as np import matplotlib.mlab as mlab import matplotlib.pyplot as plt plt.rcParams[font.sans-serif]=[SimHei] # 设置中文字体,作用设置 matplotlib 使用中文字体显示…

云原生应用架构设计原则与落地实践:从理念到便捷的方法论

云原生应用架构设计原则与落地实践:从理念到便捷的方法论pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consola…

做装饰公司网站6wordpress添加直达链接

问题描述:边缘计算设备是什么意思。 问题解答: 边缘计算(Edge Computing)是一种计算模型,其主要思想是在距离数据产生源头更近的地方进行数据处理和计算,而不是将所有数据传输到远程云服务器进行处理。边…

基于本地模型+多级校验设计的高效缓存,有效节省token数量(有点鸡肋doge) - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …