教学方面网站建设智能手机软件开发

pingmian/2025/10/8 10:52:37/文章来源:
教学方面网站建设,智能手机软件开发,孝感应城网站建设,网站开发 例子作者#xff1a;Freemanzxp简介#xff1a;中科大研二在读#xff0c;目前在微软亚洲研究院实习#xff0c;主要研究方向是机器学习。原文#xff1a;https://blog.csdn.net/zpalyq110/article/details/79527653Github#xff1a;https://github.com/Freemanzxp/GBDT_Sim… 作者Freemanzxp简介中科大研二在读目前在微软亚洲研究院实习主要研究方向是机器学习。原文https://blog.csdn.net/zpalyq110/article/details/79527653Githubhttps://github.com/Freemanzxp/GBDT_Simple_Tutorial本文已授权未经原作者允许不得二次转载写在前面 去年学习 GBDT 之初为了加强对算法的理解整理了一篇笔记形式的文章发出去之后发现阅读量越来越多渐渐也有了评论评论中大多指出来了笔者理解或者编辑的错误故重新编辑一版文章内容更加翔实并且在 GitHub 上实现了和本文一致的 GBDT 简易版包括回归、二分类、多分类以及可视化供大家交流探讨。感谢各位的点赞和评论希望继续指出错误~Githubhttps://github.com/Freemanzxp/GBDT_Simple_Tutorial简介GBDT 的全称是 Gradient Boosting Decision Tree梯度提升树在传统机器学习算法中GBDT 算得上 TOP3 的算法。想要理解 GBDT 的真正意义那就必须理解 GBDT 中的 Gradient Boosting 和 Decision Tree 分别是什么1. Decision TreeCART回归树首先GBDT 使用的决策树是 CART 回归树无论是处理回归问题还是二分类以及多分类GBDT 使用的决策树通通都是都是 CART 回归树。为什么不用 CART 分类树呢因为 GBDT 每次迭代要拟合的是梯度值是连续值所以要用回归树。对于回归树算法来说最重要的是寻找最佳的划分点那么回归树中的可划分点包含了所有特征的所有可取的值。在分类树中最佳划分点的判别标准是熵或者基尼系数都是用纯度来衡量的但是在回归树中的样本标签是连续数值所以再使用熵之类的指标不再合适取而代之的是平方误差它能很好的评判拟合程度。回归树生成算法输入训练数据集 D:输出回归树 f(x).在训练数据集所在的输入空间中递归的将每个区域划分为两个子区域并决定每个子区域上的输出值构建二叉决策树1选择最优切分变量 j 与切分点 s求解遍历变量 j对固定的切分变量 j 扫描切分点 s选择使得上式达到最小值的对 (j,s).2用选定的对 (j,s) 划分区域并决定相应的输出值3继续对两个子区域调用步骤1和2直至满足停止条件。4将输入空间划分为 M 个区域 生成决策树2. Gradient Boosting拟合负梯度梯度提升树Grandient Boosting是提升树Boosting Tree的一种改进算法所以在讲梯度提升树之前先来说一下提升树。先来个通俗理解假如有个人30岁我们首先用20岁去拟合发现损失有10岁这时我们用6岁去拟合剩下的损失发现差距还有4岁第三轮我们用3岁拟合剩下的差距差距就只有一岁了。如果我们的迭代轮数还没有完可以继续迭代下面每一轮迭代拟合的岁数误差都会减小。最后将每次拟合的岁数加起来便是模型输出的结果。提升树算法 b拟合残差学习一个回归树得到上面伪代码中的残差是什么损失函数是我们本轮迭代的目标是找到一个弱学习器最小化让本轮的损失当采用平方损失函数时这里是当前模型拟合数据的残差residual所以对于提升树来说只需要简单地拟合当前模型的残差。回到我们上面讲的那个通俗易懂的例子中第一次迭代的残差是10岁第二 次残差4岁……当损失函数是平方损失和指数损失函数时梯度提升树每一步优化是很简单的但是对于一般损失函数而言往往每一步优化起来不那么容易针对这一问题Freidman 提出了梯度提升树算法这是利用最速下降的近似方法其关键是利用损失函数的负梯度作为提升树算法中的残差的近似值。那么负梯度长什么样呢第 t 轮的第 i 个样本的损失函数的负梯度为此时不同的损失函数将会得到不同的负梯度如果选择平方损失负梯度为此时我们发现 GBDT 的负梯度就是残差所以说对于回归问题我们要拟合的就是残差。log(loss)本文以回归问题为例进行讲解。3. GBDT算法原理上面两节分别将 Decision Tree 和 Gradient Boosting 介绍完了下面将这两部分组合在一起就是我们的 GBDT 了。GBDT算法2对有计算负梯度即残差作为下棵树的训练数据得到一颗新的回归树其对应的叶子节点区域为。其中 J 为回归树 t 的叶子节点的个数。计算最佳拟合值 d更新强学习器3得到最终学习器4. 实例详解 本人用 python 以及 pandas 库实现 GBDT 的简易版本在下面的例子中用到的数据都在 github 可以找到大家可以结合代码和下面的例子进行理解欢迎 star~  Githubhttps://github.com/Freemanzxp/GBDT_Simple_Tutorial数据介绍 如下表所示一组数据特征为年龄、体重身高为标签值。共有5条数据前四条为训练样本最后一条为要预测的样本。训练阶段 参数设置 学习率learning_rate0.1迭代次数n_trees5树的深度max_depth31.初始化弱学习器:损失函数为平方损失因为平方损失函数是一个凸函数直接求导倒数等于零得到 c。令导数等于0所以初始化时c取值为所有训练样本标签值的均值。c(1.11.31.71.8)/41.475此时得到初始学习器2.对迭代轮数m12,…,M:由于我们设置了迭代次数n_trees5这里的 M5。的差值此时将残差作为样本的真实值来训练弱学习器即下表数据接着寻找回归树的最佳划分节点遍历每个特征的每个可能取值。从年龄特征的5开始到体重特征的 70 结束分别计算分裂后两组数据的平方损失Square Error 左节点平方损失 右节点平方损失找到使平方损失和 最小的那个划分节点即为最佳划分节点。例如以年龄 7 为划分节点将小于 7 的样本划分为到左节点大于等于 7 的样本划分为右节点。左节点包括 x0右节点包括样本所有可能划分情况如下表所示以上划分点是的总平方损失最小为0.025有两个划分点年龄21和体重60所以随机选一个作为划分点这里我们选 年龄21现在我们的第一棵树长这个样子我们设置的参数中树的深度 max_depth3现在树的深度只有 2需要再进行一次划分这次划分要对左右两个节点分别进行划分对于左节点只含有 0,1 两个样本根据下表我们选择 年龄7 划分对于右节点只含有 2,3 两个样本根据下表我们选择 年龄30 划分也可以选体重70现在我们的第一棵树长这个样子此时我们的树深度满足了设置还需要做一件事情给这每个叶子节点分别赋一个参数 γ来拟合残差。这里其实和上面初始化学习器是一个道理平方损失求导令导数等于零化简之后得到每个叶子节点的参数 γ其实就是标签值的均值。这个地方的标签值不是原始的 y而是本轮要拟合的标残差 .根据上述划分结果为了方便表示规定从左到右为第个叶子结点此时的树长这个样子此时可更新强学习器需要用到参数学习率learning_rate0.1用 lr 表示。为什么要用学习率呢这是Shrinkage的思想如果每次都全部加上学习率为1很容易一步学到位导致过拟合。重复此步骤直到 结束最后生成5棵树。下面将展示每棵树最终的结构这些图都是GitHub上的代码生成的感兴趣的同学可以去一探究竟https://github.com/Freemanzxp/GBDT_Simple_Tutorial第一棵树第二棵树第三棵树第四棵树第五棵树4.得到最后的强学习器5.预测样本5中样本4的年龄为25大于划分节点21岁又小于30岁所以被预测为0.2250。在中样本4的…此处省略…所以被预测为0.2025为什么是 0.2025这是根据第二颗树得到的可以 GitHub 简单运行一下代码在中样本4的…此处省略…所以被预测为0.1823在中样本4的…此处省略…所以被预测为0.1640在中样本4的…此处省略…所以被预测为0.1476最终预测结果5. 总结 本文章从GBDT算法的原理到实例详解进行了详细描述但是目前只写了回归问题GitHub 上的代码也是实现了回归、二分类、多分类以及树的可视化希望大家继续批评指正感谢各位的关注。Github:https://github.com/Freemanzxp/GBDT_Simple_Tutorial参考资料 李航 《统计学习方法》Friedman J H . Greedy Function Approximation: A Gradient Boosting Machine[J]. The Annals of Statistics, 2001, 29(5):1189-1232.欢迎关注我的微信公众号--机器学习与计算机视觉或者扫描下方的二维码大家一起交流学习和进步

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/89290.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

做网站用小公司还是大公司好做新网站都需要准备什么

些工具都是用于管理 Node.js 包和依赖项的 npm (Node Package Manager): npm 是 Node.js 的默认包管理工具,随同 Node.js 安装。主要功能包括安装、发布、管理 JavaScript 包和依赖项。npm 是最常用的包管理工具之一,拥有庞大的包仓库(npm Re…

莱州网站制作电子商务网站的类型

文章目录一、maven操作二、运行SpringBoot项目三、Spring Boot 热部署一、maven操作 说明执行命令删除.lastUpdated结尾的文件for /r %i in (*.lastUpdated) do del %imaven打包跳过测试mvn clean install -DskipTests 二、运行SpringBoot项目 说明执行命令直接运行jarnohup …

移动网站如何优化排名页面设计风格的主要内容

(选择一项) 3A: B: C: D: 正确答案是 B解析:LinkedList是实现List,Collection接口,是链表方式进行构建的,根据开发要求不同,可以使用LinkedList实现栈(先进先出)和堆(先进后出)这样的数据结构。(选择一项) 4A: B: C: D: 正确答案是 C解析:由于Hashtable是线程…

买极速赛车网站会动手做不汉川网站建设

旁路 旁路电容是为本地器件提供能量的储能器件,它能使稳压器的输出均匀化,降低负载需求。就像小型可充电电池一样,旁路电容能够被充电,并向器件进行放电。为尽量减少阻抗,旁路电容要尽量靠近负载器件的供电电源管脚和…

成都wap网站建设百度小程序审核

一、关于准考信下载 为确保您顺利进入考场参加xxx月份考试,请及时登录本网站个人系统下载并打印准考信,准考信下载时间为xxx-xxx。如通过以上方式无法查找准考信,请您及时拨打所在考点老师联系电话,如有特殊问题,请发…

英文网站建设多少钱建筑设计人才招聘

题目描述 给定a0,a1,以及anpa(n-1) qa(n-2)中的p,q。这里n > 2。 求第k个数对10000的模。 输入描述: 输入包括5个整数&#xff1a;a0、a1、p、q、k。 输出描述: 第k个数a(k)对10000的模。 分析 循环求出ak即可 #include <iostream>using namespace std;int main(){in…

网站制作的基础虚拟主机怎么用

2019 年8 月7 日&#xff0c;旧金山讯——AMD 公司今日召开发布会&#xff0c;在空前壮大的数据中心产业链合作伙伴和客户的见证下&#xff0c;正式发布了第二代 AMD EPYC&#xff08;霄龙&#xff09;系列处理器&#xff0c;为众多企业级、云和高性能计算(HPC)工作负载带来领先…

备案的时候需要网站吗琪歌 wordpress

重庆网络广播电视台记者 余韬2019中国国际智能产业博览会上&#xff0c;各具特色的智能制造装备和机器人纷纷亮相。其中一款能和人下象棋的机器人吸引了大批观众的目光&#xff0c;大家都抢着要跟机器人“一决高下”。“机械手上有视觉辨识系统&#xff0c;识别出放象棋的位置之…

如何做好电子商务网站开发手机版网站怎样做推广

导语&#xff1a;读万卷书不如行万里路&#xff0c;行万里路不如名师点悟。选导师也是个大学问——择师而师&#xff0c;不可草草。为此我们特邀请众多精英导师&#xff0c;我们期待他们的亲身经历和观点建议&#xff0c;能够给考研路上的你以参考……华北电力大学计算机科学与…

当当网的网站建设目标是巫山集团网站建设

背景&#xff1a; 前端系列会收集碎片化的前端知识点&#xff0c;作为自己工作和学习时的字典&#xff0c;欢迎读者收藏和使用。 笔者是后端开发&#x1f636;前端涉猎不深&#xff0c;因此文章重在广度和实用&#xff0c;对原理和性能不会过多深究。 1.html 1.1 html5网页结…

网站域名跳转图盛网站建设

一、安装 双击安装文件&#xff0c;然后安装指引点击下一步 ​​ 选择【Custom】安装类型 ​​ 将程序安装到D盘MongoDB目录下&#xff08;如果切换了目录&#xff0c;记得对应调整monggo.bat下面的路径&#xff09; ​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​…

深圳高品质网站建设服务学做网站能找到工作么

php中文网最新课程每日17点准时技术干货分享Composer 是 PHP 的一个依赖管理工具。我们可以在项目中声明所依赖的外部工具库&#xff0c;Composer 会帮你安装这些依赖的库文件&#xff0c;有了它&#xff0c;我们就可以很轻松的使用一个命令将其他人的优秀代码引用到我们的项目…

群辉做网站服务器配置建设网站要用什么软件

程序中代码执行的顺序非常重要&#xff0c;稍有不慎便会是程序运行出错&#xff0c;那么我将结合实例来分析代码中的执行。名词解释首先了解几个名词&#xff1a;非静态代码块直接由 { } 包起来的代码&#xff0c;称为非静态代码块静态代码块直接由 static { } 包起来的代码&am…

石家庄做网站制作苏州seo排名

湖仓一体架构理论与实践汇总 软件研发本质上属于“手工业”。软件研发在很大程度上还是依赖于个人的能力。当软件规模较小时&#xff0c;依赖“手工业”可以解决问题&#xff0c;但是当软件规模大了之后再依赖“手工业”就不行了。 软件的复杂度包含两个层面&#xff1a;软件…

昆山建设银行交学费的网站wordpress的登入页面

文章目录 1. 结构体1.1 结构体的声明1.2 结构体成员的访问1.3 匿名结构体1.4 结构体的自引用1.5 结构体内存对齐&#xff08;计算结构体的大小&#xff09;1.6 结构体传参1.6.1 传值传递1.6.2 传址传递&#xff08;使用指针&#xff09; 2. 位段2.1 什么是位段&#xff1f;2.2 …

中国建设部建造师网站莱芜搜狗推广哪家好

绝地求生作为当下最火爆的吃鸡游戏&#xff0c;吸引了无数玩家的关注和参与。然而&#xff0c;要成为顶尖的吃鸡玩家&#xff0c;并不简单。在这篇文章中&#xff0c;我们将为你揭露绝地求生玩家最关心的吃鸡要领和细节&#xff0c;为你提供一份全方位的游戏指南&#xff01; 1…

找人做个网站建设制作报价方案lnmp wordpress lamp

文章目录 概要问题案例解决方法 概要 在小程序里面一般循环使用ref的话会获取不到 问题案例 //这个时自己封装的组件&#xff0c;然后循环使用 <jilianXuanzhe huoqu"huoqu" :ref"jilianXuanzhe i"></jilianXuanzhe>//如果这样使用的话获取…

北京做校园的网站重庆专业微网站建设

在不久前发布的开源虚拟化战略和路线图中,红帽宣称将在未来的3至18个月内,提供四种虚拟化技术和产品,包括:红帽企业Linux、红帽企业虚拟化 Hypervisor、红帽企业服务器虚拟化管理、红帽企业桌面虚拟化管理.今天,他们公布了最新版Red Hat Enterprise Linux, RHEL 5.4.它支持广泛…

石家庄做网站排名公司哪家好网站模板下载好之后如何安装

转载公众号 | 老刘说NLP 安全知识图谱是网络安全领域专用知识图谱&#xff0c;也是知识图谱应用于安全业务的重要工业尝试。当前&#xff0c;安全领域中存在大量的业务数据&#xff0c;建模需求以及应用需求&#xff0c;了解安全领域知识图谱的建设方法以及典型应用场景&#x…

网站开发 前端如何学习福州网站建设兼职

我想稍微远离PHP&#xff0c;学习Python。为了使用Python进行Web开发&#xff0c;我需要一个框架来帮助模板和其他事情。我有一台非生产服务器&#xff0c;用于测试所有Web开发内容。这是一个运行MariaDB而不是常见的MySQL服务器软件包的Debian 7.1 LAMP堆栈。昨天我安装了Djan…