XGBoost

XGBoost

XGBoost的算法原理

​ 设选择了使用$k$个Tree来拟合数据,XGBoost的原理是使用第一颗树来拟合原始数据,得到$\hat y_1$,然后用$\hat y_1$替换原来的$y$,再用第二颗树来拟合数据。最终的预测结果是每个数的预测结果之和。对于给定的样本点$x_i$,第$k$轮后的总预测值为
$$
\widehat {y}_i{(k)}=\sum_{j=1} f_j(x_i),f_j\in \mathcal{F}
$$

其中,$f_j(x_i)$表示第$j$个软模型的预测值。那么,模型的优化目标就可写成以下形式,
$$
Obj = \sum_{i=1}^{n} \mathcal{L}(y_i,\widehat {y}_i{(k)})+\sum_{j=1}k \Omega(f_j)
$$

其中,$\mathcal{L}(y_i,\widehat {y}_i^{(k)})$表示损失函数,$\Omega(f_j)$表示模型复杂度。模型的迭代过程如下所示
$$
\widehat y_i^{(0)}=0
$$

$$
\widehat y_i^{1}=\widehat y_i^{(0)} + f_1(x_i)
$$

$$
\vdots
$$

$$
\widehat y_i^{k}=\widehat y_i^{(k-1)} + f_k(x_i)
$$

模型的优化目标可以按照以下部分拆分。
$$
Obj=\sum_{i=1}^n \mathcal{L}(y_i,\widehat y_i^{(k-1)} +f_k(x_i)) + \sum_{j=1}^{k-1} \Omega(f_j) +\Omega(f_k)
$$

其中,$\sum_{j=1}^{k-1} \Omega(f_j) $已知,可看作常数,故优化目标可改写为以下形式。
$$
Obj=\sum_{i=1}^n \mathcal{L}(y_i,\widehat y_i^{(k-1)}+f_k(x_i))+\Omega(f_k)
$$

$$
Obj \approx \sum_{i=1}^n [\mathcal{L}(y_i,\widehat y_i^{(k-1)})+\partial_{\widehat y_i^{(k-1)}}(\mathcal{L}(y_i,\widehat y_i^{(k-1)}) \cdot f_k(x_i)+ \frac{1}{2} \partial_{\widehat y_i{(k-1)}}2\mathcal{L}(y_i,\widehat y_i^{(k-1)}) \cdot f_k(x_i)^2]+\Omega(f_k)
$$

令$g_i=\partial_{\widehat y_i^{(k-1)}}(\mathcal{L}(y_i,\widehat y_i^{(k-1)}))$,$h_i=\partial_{\widehat y_i{(k-1)}}2\mathcal{L}(y_i,\widehat y_i^{(k-1)})$

此时,
$$
Obj=\sum_{i=1}^n [g_i \cdot f_k(x_i)+ \frac{1}{2} h_i \cdot f_k(x_i)^2]+\Omega(f_k)
$$

$$
\Omega(f_k)=\gamma \cdot T + \frac{1}{2} \lambda \sum_{j=1}^T\Vert \omega_j \Vert^2
$$

其中,$T$为叶节点个数,$\lambda,\gamma$为超参数,$\omega_j$为叶节点的值。

此时
$$
Obj=\sum_{i=1}^n [g_i \cdot f_k(x_i)+ \frac{1}{2} h_i \cdot f_k(x_i)^2]+\gamma \cdot T + \frac{1}{2} \lambda \sum_{j=1}^T\Vert \omega_j \Vert^2
$$

令$\omega_j$表示叶节点的值,$q(x_i)$表示样本$x_i$所在叶节点位置,所以可以用以下方式表示软模型预测
$$
\omega_{q(x_i)}=f_k(x_i)
$$
于是,优化目标可以改写为
$$
Obj=\sum_{i=1}^n [g_i \cdot \omega_{q(x_i)}+ \frac{1}{2} h_i \cdot \omega_{q(x_i)}^2]+\gamma \cdot T + \frac{1}{2} \lambda \sum_{j=1}^T\Vert \omega_j \Vert^2
$$

$$
I_j={i|q(x_i)=j}
$$

$$
Obj = \sum_{j=1}^T [(\sum_{i \in I_j} g_i) \cdot \omega_j+ \frac{1}{2}(\sum_{i \in I_j} h_j+\lambda) \cdot \omega_j^2]+\lambda T
$$

令$G_j = \sum_{i \in I_j} g_i$,$H_j = \sum_{i \in I_j} h_i$,且均为常数,此时$Obj$可以写为
$$
Obj = \sum_{j=1}^T[G_j \cdot \omega_j+ \frac{1}{2} \cdot(H_j+\lambda) \cdot \omega_j^2]+\gamma T
$$
这是一个一元二次函数,可以求得最优解
$$
\omega_j^* = -\frac{G_j}{H_j+\lambda}
$$
带入$\omega_j^$,求得
$$
Obj^
= - \frac{1}{2} \sum_{j=1}^T \frac {G_j^2}{H_j+\lambda}+\gamma T
$$
那么,如何将这个找到对应的函数呢,也就是每一个小模型。

1、暴力搜索,找寻所有树结构,但是这是超出计算能力了

2、贪心算法

​ 也就是类似于决策树,考虑每一步的信息增益。但这里考虑的信息增益是$Obj$的变化量。、

$$
Gain = Obj_{old}*-Obj_{new}*
$$

这里假设$model_{old}$右侧叶节点包含样本点7、8,左侧包含1、2、3、4、5、6,此时$Obj_{old}^$的值为
$$
Obj_{old}*=-\frac{1}{2}[\frac{(g_7+g_8)2}{h_7+h_8+\lambda} + \frac{(g_1+g_2+\cdots +g_6)^2}{h_1+h_2+\cdots h_6 +\lambda}]+2\gamma
$$
同时,假设根据特征$i$分成的$model_{new}$中,$L$包含1、3、5节点,$R$包含2、4、6节点,此时$Obj_{new}^
$的值为
$$
Obj_{new}*=-\frac{1}{2}[\frac{(g_7+g_8)2}{h_7+h_8+\lambda} + \frac{(g_1+g_3+g_5)^2}{h_1+h_3+h_5 +\lambda}+\frac{(g_2+g_4+g_6)^2}{h_2+h_4+h_6 +\lambda}]+3\gamma
$$

$$
Gain = -\frac{1}{2}[\frac{(g_1+g_2+\cdots +g_6)^2}{h_1+h_2+\cdots h_6 +\lambda}-\frac{(g_1+g_3+g_5)^2}{h_1+h_3+h_5 +\lambda}-\frac{(g_2+g_4+g_6)^2}{h_2+h_4+h_6 +\lambda}]-\gamma
$$

$$
Gain=\frac{1}{2}[\frac{G_L^2}{H_L+\lambda} + \frac{G_R2}{H_R+\lambda}-\frac{(G_L+G_R)2}{H_L+H_R+\lambda}]-\gamma
$$

其中,$G_L=g_1+g_3+g_5$,$H_L=h_1+h_3+h_5$,$G_R=g_2+g_4+g_6$,$H_R=g_2+g_4+g_6$

选取最大的$Gain$来进行生成树。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/926063.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LLM大模型:deepseek sparse attention是个啥?

1、近期,deepseek-3.2-EXP发布,价格大幅下降,如下:价格大幅下降,这是谁给的底气了?必定是成本大幅下降呗,否则不得亏死?那么问题又来了:成本又是怎么大幅下降的了?2、时至今日,尽管被各种吐槽(其中不乏yan…

做公司网站需要制作内容济宁网站开发公司

有时候被ZABBIX监控的主机可能需要关机重启等维护操作,为了在此期间不触发告警,需要创建主机的维护任务,以免出现误告警 ZABBIX本身有这个API可供调用(不同版本细节略有不同,本次用的ZABBIX6.*),实现批量化建立主机的维护任务 无论哪种方式(IP列表,主机描述,或IP子网)创建维护…

如何更换网站图片wordpress 设置图片大小

11.2.0.3数据库环境,使用rman进行归档日志备份,想实现: (1)每天备份归档日志,备份完并不删除归档日志 (2)归档日志备份成功一次之后,下次再备份的时候rman就自动不会再次备份这个归档日志 这个需求可以通过 backup …

北京专业网站翻译影音字幕翻译速记速记快而高效公司网站的seo优化怎么做

2019独角兽企业重金招聘Python工程师标准>>> 快捷菜单 当用户点击界面上某个元素超过2秒后,将启动注册到该界面的快捷菜单。 步骤: 1.代码动态生成菜单 final static int CONTEXT_MENU_1 Menu.FIRST;final static int CONTEXT_MENU_2 Menu…

vs做网站怎样添加图片普通网站报价多少

用过小米miui的用户都知道,miui的“文件管理”里边有一个非常好用的功能-远程管理,如果手机与电脑都在同一个wifi网络下,即同一个局域网内,不用数据线直接就可以连接。打开手机的文件管理—远程管理—启动服务,将生成一…

一个公司可以做两个网站推广吗分类信息网站织梦模板

缩小包围圈游戏其实是一个不可能完成的任务,但是它会给游戏者带来无尽欢笑,使小组充满活力,让队员们能够自然地进行身体接触和配合,消除害羞和忸怩感,创造融洽的气氛,为后续工作的开展奠定良好基础。可以作…

详细介绍:从零到一:Docker Compose 轻松部署微服务实战!

详细介绍:从零到一:Docker Compose 轻松部署微服务实战!2025-10-03 15:59 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !importan…

软著申请全流程材料模板,2025年最新模板汇总! - 实践

软著申请全流程材料模板,2025年最新模板汇总! - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&q…

四川话ASR-微调-语音识别-Paraformer-Large - 教程

四川话ASR-微调-语音识别-Paraformer-Large - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas"…

茂名专业网站建设公司亚马逊网站建设分析

推荐阅读 给软件行业带来了春天——揭秘Spring究竟是何方神圣(一) 给软件行业带来了春天——揭秘Spring究竟是何方神圣(二) 文章目录 推荐阅读关联查询子查询 关联查询 关联查询 从多张表中查询对应记录的信息,关联查…

手把手教你使用 Docker 部署 Nginx 教程

本文详细介绍了基于轩辕镜像的 Nginx 镜像拉取方法(含登录验证、免登录(推荐)、官方直连等方式),以及三种适合不同场景的 Docker 部署方案(快速部署用于测试、目录挂载用于实际项目、docker-compose 用于企业级场…

建站公司服务网页游戏开服表大全

TJpgDec—轻量级JPEG解码器 本文由乌合之众lym瞎编,欢迎转载blog.cnblogs.net/oloroso 下文中解码一词皆由decompression/decompress翻译而来。 TJpgDec是一个为小型嵌入式系统高度优化的创建JPEG图像的解码模块。它工作时占用的内存非常低,以便它可以集…

网站建设营销模板网站扁平化设计理念

目录 结论先说 实验 结论 实验机器的cpu配置 用EDGE拉九路​编辑 google拉五路就拉不出来了 资源使用情况 edge报错​编辑 结论先说 实验 用chrome先拉九路,再想用edge拉九路,发现拉五路后怎么也拉不出; 后面发现cpu爆满;切…

自己搭建一个网站需要多少钱?手机网站搭建教程

来源:AI前线作者:Ben Dickson译者:盖策划:凌敏本文来自 BDTechTalks 网站的“AI 研究论文评论”专栏。该专栏提供人工智能最新发现的系列解读文章。尽管人工智能研究人员正力图建立能在围棋、星际争霸到 Dota 等复杂游戏中击败人类…

CF2129 CF1951 VP 记录

非常好 hfu 开发的神秘打一场比赛改两场题,使我的国庆假期旋转. CF2129 Div1 B 逆序对考虑在较小的数处统计贡献,枚举序列里面每个数,一并枚举逆序对的另一个数. \(p_i\) 有贡献当且 \(i>j\),\(2n-p_i\) 有贡献…

PWN-BUUCTF-test_your_nc

BUUCTF-test_your_nc的WPpwn 题目题解 使用nc连接题目地址,输入ls查看目录。使用cat命令获取flag文件内容得到flag。总结 题目考察nc的使用方法本文来自博客园,作者:ffff5,转载请注明原文链接:https://www.cnblog…

做网站设计需要具备哪些重庆市工程建设服务中心

中国科学院自动化研究所智能交互团队在环境鲁棒性、轻量级建模、自适应能力以及端到端处理等几个方面进行持续攻关,在语音识别方面获新进展,相关成果将在全球语音学术会议INTERSPEECH2019发表。现有端到端语音识别系统难以有效利用外部文本语料中的语言学…

电商网站建设目标分析的方法淘宝客网站建设方案书

机器学习是一项经验技能,经验越多越好。在项目建立的过程中,实 践是掌握机器学习的最佳手段。在实践过程中,通过实际操作加深对分类和回归问题的每一个步骤的理解,达到学习机器学习的目的 预测模型项目模板 不能只通过阅读来掌握…

Kafka Windows 安装启动与 YAML 配置全解析 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

昆明专业建站装修设计公司服务

参考链接 FFmpeg源代码简单分析:avcodec_close()_雷霄骅的博客-CSDN博客_avcodec_close avcodec_close() 该函数用于关闭编码器avcodec_close()函数的声明位于libavcodec\avcodec.h,如下所示。 ​该函数只有一个参数,就是需要关闭的编码器的…