郑州网站建设技术精粹东莞房价下跌

news/2025/9/28 1:00:24/文章来源:
郑州网站建设技术精粹,东莞房价下跌,网站建设技能考,网站网站如何做的充值一、说明 时间这是集成技术下的第 4 篇文章#xff0c;如果您想了解有关集成技术的更多信息#xff0c;您可以参考我的第 1 篇集成技术文章。 机器学习算法#xff08;9#xff09; - 集成技术#xff08;装袋 - 随机森林分类器和...... 在这篇文章中#xff0c;我将解释… 一、说明 时间这是集成技术下的第 4 篇文章如果您想了解有关集成技术的更多信息您可以参考我的第 1 篇集成技术文章。 机器学习算法9 - 集成技术装袋 - 随机森林分类器和......         在这篇文章中我将解释XgBoost 分类算法。XgBoost代表Extreme Gradient Boosting这是一种旨在优化分布式梯度提升的提升技术。它是训练机器学习模型的有效且可扩展的方法。这种学习方法结合弱模型来产生更强的预测极端梯度。它由于能够处理大型数据集并在分类和回归等机器学习任务中实现最先进的性能而被广泛使用。 二、关于XGBoost XGBoost 是梯度提升的一种更正则化的形式。XGBoost 使用高级正则化L1 和 L2提高了模型泛化能力。与梯度提升相比XGBoost 提供了高性能。它的训练速度非常快并且可以跨集群并行。 XGBoost 通常使用树作为基学习器该决策树由一系列二元问题组成最终预测发生在叶子上。XGBoost 本身就是一种集成方法。迭代地构建树直到满足停止标准。 XGBoost 使用CART分类和回归树决策树。CART 是在每个叶子中包含实值分数的树无论它们是用于分类还是回归。如有必要可以将实值分数转换为类别以进行分类。 2.1 何时使用 XGBoost 当训练样本数量较多时。理想情况下训练样本大于 1000 个且特征少于 100 个或者我们可以说特征数量 训练样本数量。当存在分类特征和数字特征的混合或仅数字特征时。 2.2 什么时候不应该使用 XGBoost 图像识别计算机视觉当训练样本数量明显小于特征数量时。 让我们举一个简单的例子来更好地理解它。银行根据您的工资和信用评分这是第一、第二和第三个特征来批准您的信用卡贷款。信用评分分为“不良”、“正常”和“良好” 3 类。由于我们正在解决分类问题输出 0 或 1。XgBoost 也可用于解决多类分类问题。 工资贷款审批数据集 三、如何使用Xgboost 3.1 步骤1 - 启动XgBoost分类器时第一步是创建特定的基础模型。在分类问题的情况下该模型将始终输出 0.5 的概率输出为零或一。要计算残差请从输出值 0.5 中减去实际值。例如如果批准率为 0.5则残差将为0–0.5 -0.5。该基本模型作为所有后续决策树的基础必须按顺序构建。基本模型本身也是一种决策树因为它接受输入并提供 0.5 的默认概率。创建基本模型后下一步就是转向第一个基于顺序的决策树。 残值 3.2 第2步 - 然后我们使用相关特征创建二元决策树。然后我选择“薪水”作为第一个功能您有 2 个类别分别是50K 和 ≤50K。在XGBoost中每当你创建一棵树时你都需要做一个二元分类器。即使您有两个以上类别这也适用。 为此您需要创建一个二元分类器并对其进行划分。叶节点始终是两个。然后根据数据的相似度计算相似度权重求出Gain。 To come up with these points, we use the values,≤50K -0.5, 0.5, 0.5 and -0.5 50K -0.5, 0.5 and 0.5 3.3 步骤 3 — 接下来我们计算相似度权重其中涉及使用公式 Similarity Weight Σ(Residuals) ^2 / Σ(probability * (1 - probability) λ)λ Hyperparameter that prevents overfitting 0 (For now consider λ value as 0)probability This taken from the base modelSimilarity Weight of the left leaf node ------------------------------------Similarity Weight -0.5 0.5 0.5 -0.5 ^ 2/ [0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5)] Similarity Weight 0 / 0.25 0.25 0.25 0.25 0.25 0 / 1.25 0Similarity Weight of the right leaf node ------------------------------------ Similarity Weight -0.5 0.5 0.5 ^ 2/ [0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5)] Similarity Weight 0.5 ^ 2 / 0.75 0.25 / 0.75 1/3 0.33Similarity Weight of the root node ------------------------------------ Similarity Weight 0.5 ^ 2/ [0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5)] Similarity Weight 0.25 / 1.75 1/7 0.142 3.4 步骤4- 计算信息增益。为此我们可以将所有叶节点相似性权重加在一起并从中减去根节点的相似性权重。 Total Gain with respect to the split 0 0.33 - 0.14 0.19 好的我们选择了Salary特征进行分割我们得到的 Gain 为0.19。但我们也可以开始从Credit功能中进行拆分。如果我们开始拆分 Credit 特征则需要进行二元分类器。叶节点始终是两个。但你有两个以上的类别“坏”、“正常”和“好”。为此您可以像这样进行拆分 Step 1Bad -0.5, -0.5Good and Normal 0.5, 0.5, 0.5, 0.5 and -0.5Step 2 Similarity Weight Σ(Residuals) ^2 / Σ(probability * (1 - probability))Similarity Weight of the left leaf node ------------------------------------Similarity Weight -0.5 -0.5 ^ 2/ [0.5 * (1 - 0.5) 0.5 * (1 - 0.5)] Similarity Weight 1 / 0.25 0.25 1 / 0.5 2Similarity Weight of the right leaf node ------------------------------------ Similarity Weight 0.5 0.5 0.5 0.5 - 0.5 ^ 2/ [0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5)] Similarity Weight 2.25 / 1.25 1.8Similarity Weight of the root node ------------------------------------ Similarity Weight 0.142Step 3 Total Gain with respect to the split 2 1.8 - 0.142 3.658 现在您可以看到如果我们从 Credit 功能中分离出来我们可以获得最高的 Gain。然后您可以使用信用功能。您可以对所有组合执行此操作并选择提供最高增益的根节点特征。 好的现在我选择我的第一个单据作为信用功能并继续对该功能进行拆分。我必须再次进行二元拆分我将为第二次拆分选择“薪资”功能并将其分类为 ≤50K 和 50K。现在您可以看到有多少数据点超过 ≤50K 和 50K。 现在我们可以计算第二级叶节点的相似度权重。 Leaf Node A:Similarity Weight Σ(Residuals) ^2 / Σ(probability * (1 - probability)) -0.5^2 / 0.25 0.25 / 0.25 1Leaf Node B:Similarity Weight Σ(Residuals) ^2 / Σ(probability * (1 - probability)) -0.5^2 / 0.25 0.25 / 0.25 1Root Node:Similarity Weight -0.5 -0.5 ^ 2/ [0.5 * (1 - 0.5) 0.5 * (1 - 0.5)] Similarity Weight 1 / 0.25 0.25 1 / 0.5 2Leaf Node C:Similarity Weight Σ(Residuals) ^2 / Σ(probability * (1 - probability)) (0.5 0.5 -0.5)^2 / (0.25 0.25 0.25) 0.25 / 0.25 1 0.25 / 0.75 1/3 0.33Leaf Node D:Similarity Weight Σ(Residuals) ^2 / Σ(probability * (1 - probability)) (0.5 0.5)^2 / (0.25 0.25) 1 / 0.5 2Root Node: Similarity Weight Σ(Residuals) ^2 / Σ(probability * (1 - probability)) 0.5 0.5 0.5 0.5 - 0.5 ^ 2/ [0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5) 0.5 * (1 - 0.5)] 2.25 / 1.25 1.8Now we can calculate the Information Gain: Information Gain Left Tree Similarity Weight of A Similarity Weight of B - Similarity Weight of Root Node 1 1 - 2 0Information Gain Left Tree Similarity Weight of C Similarity Weight of D - Similarity Weight of Root Node 0.33 2 - 1.8 0.53 我们将根据信息增益来比较哪种分割是最好的。现在我已经创建了整个决策树。让我们考虑推理部分。假设一条新记录将进入模型以及我们如何计算输出。首先该行将转到基本模型。那么基本模型将给出 0.5 的概率。现在我们如何从基本模型计算真实概率为此我们可以应用称为Logs的东西。我们可以使用一个公式来计算概率。 P Base Model Probability Log (P/1-P) Log (0.5 / 1 - 0.5) Log(1) 0 如果我们仔细看看这等于零。这意味着初始值将为零并通过二元决策树。 所得值将添加到属于不良信用限额且薪资≤ 50K 的分支机构。相似度权重为1我们传递学习率参数(α)。 0 α (1) α Learning Rate 0.001 将学习率参数乘以相似度权重1得到参考值。我们使用 Alpha 值α作为我们的学习率它可以是基于我们在其他地方定义的学习参数的最小值。为了解决这个分类问题我们应用称为 Sigmoid(σ) 的激活函数。这可确保输出值落在零和一之间。 σ (0 α (1)) 同样您也可以创建其他决策树。 所以最后你的新记录的输出将是这样的 σ (0 α1 (Dicision Tree Similarty Weight1) α2 (Dicision Tree Similarty Weight2) α3 (Dicision Tree Similarty Weight3) α4 (Dicision Tree Similarty Weight4) ..... αn (Dicision Tree Similarty Weightn)) 类似地该算法会生成多个决策树并将它们相加组合以生成更好的估计。 四、XGBoost的优点 性能XGBoost 在各种机器学习任务中产生高质量结果方面拥有良好的记录尤其是在 Kaggle 竞赛中它一直是获胜解决方案的热门选择。可扩展性XGBoost 专为机器学习模型的高效且可扩展的训练而设计使其适用于大型数据集。可定制性XGBoost 具有广泛的超参数可以调整这些超参数来优化性能从而使其高度可定制。处理缺失值XGBoost 具有处理缺失值的内置支持可以轻松处理经常包含缺失值的现实数据。可解释性与某些难以解释的机器学习算法不同XGBoost 提供了特征重要性可以更好地理解哪些变量在做出预测时最重要。 五、XGBoost 的缺点 计算复杂性XGBoost 可能是计算密集型的特别是在训练大型模型时使其不太适合资源受限的系统。过度拟合XGBoost 很容易过度拟合特别是在小数据集上训练或模型中使用太多树时。超参数调整XGBoost 有许多可以调整的超参数因此正确调整参数以优化性能非常重要。然而找到最佳参数集可能非常耗时并且需要专业知识。内存要求XGBoost 可能会占用大量内存尤其是在处理大型数据集时因此不太适合内存资源有限的系统。 这就是 XgBoost 分类器的全部内容。我希望你能更好地理解这个算法。在另一个教程中见。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/920141.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手机网站打不开邹平做网站的公司

这两个类都实现了 List 接口(List 接口继承了 Collection 接口),他们都是有序集合 ①线程安全:Vector 使用了 Synchronized 来实现线程同步,是线程安全的,而 ArrayList 是 非线程安全的。 ②性能&#x…

无锡公共工程建设中心网站html代码换行

自定义组件 组件的创建与引用1、创建组件2、引用组件3、全局引用VS局部引用4、组件和页面的区别 样式1、组件样式隔离2、组件样式隔离的注意点3、stylelsolation的可选值 数据、方法和属性1、data数据2、methods方法3、properties4、data和properties区别5、使用setData修改pr…

苍穹外卖-day02(新增员工,员工分页查询,启用禁用员工账号,编辑员工,导入分类模块功能代码) - a

苍穹外卖-day02(新增员工,员工分页查询,启用禁用员工账号,编辑员工,导入分类模块功能代码) 课程内容新增员工 员工分页查询 启用禁用员工账号 编辑员工 导入分类模块功能代码功能实现:员工管理、菜品分类管理。…

US$52 KVM V3 Adapter for Yanhua Mini ACDP Module9 Land Rover

KVM V2 Adapter for Yanhua Mini ACDP Module9 Land RoverKVM V2 Adapter for Yanhua Mini ACDP Module9 Land Rover, is specially for those customers whose KVM M2 adapter is missing or broken. Its in Module9 …

智慧决策的透明化路径:空白金兰契架构下的悟空备案制研究

智慧决策的透明化路径:"空白金兰契"架构下的"悟空备案制"研究 AI元人文/岐金兰 一、引言:从"黑箱"到"白箱"的AI决策革命 人工智能技术的飞速发展使其在越来越多的领域承担决…

纯js做网站景县做个油管的网站怎么做

文章目录0.友情链接1.引言2.创建一个元表2.1.__tostring方法2.2.__add和__mul方法2.3.__index方法2.4.__call方法3.完整代码0.友情链接 GitHUb上下载Lua编译器Lua菜鸟教程中的元表介绍(较全,但功能性受限)博客园内元表的介绍(较详…

US$114 BWM FEM/BDC Authorization for CGDI Prog BMW MSV80

BWM FEM/BDC Authorization for CGDI Prog BMW MSV80Now CGDI Prog BMW MSV80 add BWM FEM/BDC function for free, while if your CGDI BMW was bought before Oct, 2017, will still need to pay for it alone.No ne…

机械行业网站怎么做企业163邮箱登录

项目介绍 在工作中使用的管理系统,可以随手记录一些笔记、可以汇总一些常用网站的链接、可以管理自己负责的项目、可以记录每日日报和查看历史日报、可以记录加班情况、可以记录报销内容、可以编写文章文档。 系统功能 我的笔记快捷入口项目管理今日日报我的日报…

重庆 机械有限公司 江北网站建设网站设计目标 优帮云

0 向量 就是分量全为 0 的向量 (0 0 … 0)单位向量 就是 L2 范数/模/长度为 1 的向量 如果一个向量大部分的位置为0, 少部分为非0的数, 那这样的向量我们就称之为稀疏向量, 反之为稠密向量, 它们是数学里面…

云龙微网站开发seo技术专员招聘

表格存储Tablestore入门手册系列主要介绍表格存储的各个功能接口和适用场景,帮助客户了解和使用表格存储Tablestore。本文对表格存储Tablestore的UpdateRow接口进行介绍,包括其参数、功能示例、使用场景等。 接口概述 UpdateRow接口是表格存储Tablestor…

广东省建设安全协会网站html5商城网站

函数有自己的类型,可以像使用基础类型一样使用函数,包括将函数保存在变量中、保存在 vec 中、声明在结构体成员字段中。闭包函数也是函数,也有自己的类型定义。不过,函数实际上是指针类型,在 rust 所有权中属于借用的关…

使用 preact 渲染组件到任何元素

import { render } from preactconst frag = document.createDocumentFragment() render(<CustomComponent />, frag)const container = document.querySelector(#container) as HTMLElement container.prepend(…

网站怎么申请微信认证wordpress后台如何设置为中文

求单源最短路的SPFA算法的全称是&#xff1a;Shortest Path Faster Algorithm。 SPFA算法是西南交通大学段凡丁于1994年发表的。 从名字我们就可以看出&#xff0c;这种算法在效率上一定有过人之处。 很多时候&#xff0c;给定的图存在负权边&#xff0c;这时类似…

徐州网站建设系统电子商务网站的建设课件

a[[app,ap,ade],[er],[bcc,brt]] 将这么一个list 转换成 a2[app,ap,ade,er,bcc,brt] 做法&#xff1a;a2[x for tup in a for x in tup] 转载于:https://www.cnblogs.com/cheng-cheng/p/10027446.html

万户网络网站建设网页设计常用代码

十七、MyBatis的注解式开发 mybatis中也提供了注解式开发方式&#xff0c;采用注解可以减少Sql映射文件的配置。 当然&#xff0c;使用注解式开发的话&#xff0c;sql语句是写在java程序中的&#xff0c;这种方式也会给sql语句的维护带来成本。 官方是这么说的&#xff1a; 使…

网站和网页的目的手机网站开发开发

目录 VLAN 技术原理和配置1. VLAN 技术的背景2. VLAN 标签的产生方法3. VLAN 标签的应用规则4. VLAN 的配置总结 VLAN 技术原理和配置 1. VLAN 技术的背景 VLAN&#xff08;Virtual Local Area Network&#xff09;是一种逻辑上划分网络的技术&#xff0c;可以将一个物理局域…

公司网站建设外包流程郑州vi设计公司

目录 一、背景二、过程三、总结 一、背景 十年前结缘&#xff0c;也许是冥冥中自有天注定&#xff0c;注定要给自己多加一个今天的节日。 二、过程 一个勋章&#xff0c;一个有意义的标志。 一个勋章&#xff0c;一个时间轮上的帧。 一个勋章&#xff0c;一个二进制的节点。…

网站空间被攻击wordpress页面视频播放

目录 配置环境 http配置 配置步骤 1、首先安装Nginx&#xff08;已经安装的跳过这步&#xff09; 2、查看一下下Nginx的配置文件结构&#xff0c;了解如何配置&#xff0c;以及配置的各个条目有什么作用&#xff08;为接下来的配置打基础&#xff09; 3、创建你的网页 4、…

网站可以做多少事情菏泽企业做网站

简介 该项目采用微服务架构&#xff0c;实现了前后端分离的系统设计。在前端&#xff0c;我们选择了 Vue3 配合 TypeScript 和 ElementUi 框架&#xff0c;以提升开发效率和用户体验。而在后端&#xff0c;则是运用 SpringBoot 和 Mybatis-plus 进行开发&#xff0c;保证了系统…

建设农产品网站总结ppt怎么制作手机网页链接

ssm会议管理系统源码和论文087 开发工具&#xff1a;idea 数据库mysql5.7 数据库链接工具&#xff1a;navcat,小海豚等 技术&#xff1a;ssm 摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff0c;归纳&…