09. 集成学习

一、集成学习

  集成学习通过某种策略组合多个个体学习器的预测结果来提高整体的预测能力。只包含同种类型的个体学习器的集成称为 同质集成。同质集成中的各个学习器亦称为 基学习器,相应的学习算法称为 基学习算法。包含不同类型的个体学习器的集成称为 异质集成

  集成学习有三大经典方法:BoostingBaggingStacking

  • Boosting(提升方法):按顺序训练模型,每个模型关注前一个模型的错误,通过加权调整来优化整体预测。
  • Bagging(自助聚合):从原始数据集中通过有放回的对样本采样生成多个子数据集,分别训练多个独立模型,最后通过投票(分类)或平均(回归)得到结果。
  • Stacking(堆叠):训练多个不同类型的个体学习器,之后使用一个元模型综合多个个体学习器的预测。灵活性强,能结合多种模型的优势。

二、AdaBoost

  在概率近似正确学习的框架中,一个概念如果存在一个多项式的学习算法能够学习它,并且正确率很高,就称这个概念是 强可学习的。一个概念如果存在一个多项式的学习算法能够学习它,但正确率仅比随机猜测略好,就称这个概念是 弱可学习的。后来证明,强可学习与弱可学习是等价的。

  对于分类问题而言,给定一个训练数据集,求比较粗糙的分类规则(弱分类器)要比求精确的分类规则(强分类器)容易的多。Boosting 就是从弱学习算法出发,反复学习,得到一系列弱分类器,然后组合这些弱分类器构成一个强分类器。AdaBoost 通常使用单层决策树作为基学习器,单层决策树也被称为 决策树桩

  大部分 Boosting 都是改变训练数据的概率分布(权重分布),针对不同的训练数据分布调用弱学习算法一系列弱分类器。AdaBoost(Adaptive Boosting,自适应提升)的做法是提高被前一轮弱分类错误分类的样本的权重,降低被正确分类的样本的权重。这样一来,后一轮弱学习器会更加关注那些没有被正确分类的数据。同时采用加权多数表决的方法,加大分类误差率小的弱分类器的权重,减少分类误差率大的弱分类器的权重。

三、随机深林

  随机深林是 Bagging 的一种变体,在以决策树为基学习器构建 Bagging 集成的基础上,进一步在决策树训练过程中引入随机属性选择。具体来说,传统决策树在选择划分特征时是在当前节点的特征集合(假定有 d 个特征)中选择最优特征。而在随机深林中,决策树的每个节点先从该节点的特征集合中随机选择一个包含 k 个特征的子集,然后再从这个子集中选择一个最优特征用于划分。参数 k 控制着随机性的引入程度。若 k = d,则基决策树的生成与传统决策树相同。若 k = 1,则随机选择一个属性用于划分,一般推荐 \(k = log_{2}d\)

  随机深林简单易实现,但在很多任务中都展现出了强大性能,被誉为 “代表集成学习技术水平的方法”。Bagging 中基学习器的多样性仅来自样本扰动,而随机深林中基学习器的多样性不仅来自于样本扰动,还来自特征扰动,这就使得最终集成的泛化性能可通过基学习器之间差异度的增加而进一步提升。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1185595.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【课程设计/毕业设计】基于机器学习python-深度学习CNN-pytorch训练识别蝴蝶-蚂蚱等昆虫

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

AI智能体编写实战AutoGen篇(四)——会干活的导诊 Agent(Planner + Tools 实战)

AI智能体编写实战AutoGen篇(四)——会干活的导诊 Agent(Planner + Tools 实战)2026-01-19 23:09 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; over…

洛谷 P6419:[COCI 2014/2015 #1] Kamp ← 换根DP

​【题目来源】https://www.luogu.com.cn/problem/P6419【题目描述】一棵树 n 个点,n-1 条边,经过每条边都要花费一定的时间,任意两个点都是联通的。有 K 个人(分布在 K 个不同的点)要集中到一个点举行聚会。聚会…

基于人工智能的智能客服系统设计与实现 #计算机毕业设计 毕设 论文 开题报告

博主介绍 本人程序员一枚,从2017年从事开发行业到现在,我们可以从最初的java,ssm,jsp,发展到现在的spring boot vue框架,随着python的崛起,又融入了django、flask框架的web式开发,一步一步走到现在&#x…

深度学习毕设项目推荐-基于人工智能python-CNN深度学习识别猫脸

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

基于协同过滤算法的非遗文化交流平台设计与实现 #计算机毕业设计 毕设 论文 开题报告

博主介绍 本人程序员一枚,从2017年从事开发行业到现在,我们可以从最初的java,ssm,jsp,发展到现在的spring boot vue框架,随着python的崛起,又融入了django、flask框架的web式开发,一步一步走到现在&#x…

极限科技 Coco AI 荣获 2025 IT168 技术卓越奖 - 创新产品奖

2026年1月 — 在由 IT168 主办的“2025 年度技术卓越奖”评选中,极限科技的人工智能产品 Coco AI 凭借其创新的技术架构与突出的市场实践,荣获 “创新产品奖”。北京,2026 年 1 月 —— 在由 IT168 主办的“2025 年…

PLC-Recorder如何批量添加曲线?

一、分组变量一键拖拽 1.添加PLC2.添加变量3.拖拽变量二、所有变量一键拖拽 1.添加分组2.变量添加分组3.分组拖拽变量

类加载的过程,双亲委派模型以及垃圾回收机制

类加载Java的类加载过程是将.class文件中的二进制数据读入内存,并最终形成可被虚拟机直接使用的Java类型。这一过程主要分为 加载、连接(验证、准备、解析)、初始化三大阶段。加载(Loading):这是类加载的第一步,…

深度学习毕设项目推荐-基于python-CNN卷积神经网络机器学习的柑橘成熟度识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

Shader中颜色的加法和乘法的区别

最近在抽空复习图形学,我一开始没注意到环境光、漫反射、镜面反射的处理方式是通过向量加法,即ambient + diffuse + specular 直到后来研究多光源时,才发现不同光源的最终光照值也是通过向量加法计算的。这时我才突…

谈谈我是如何面试技术人员的

1.面试的重点不是为难面试者,自己炫技 2.面试是把他当作你的同事,跟他探讨问题 3.尽量对他擅长的点进行深度挖掘 4.要引导面试者讲出他擅长的点和深度的点系统性的需要考察的知识点: 判断能力的大概打分系统: 我自…

自制py功能包解析IMU航迹推算

在 ROS Melodic 环境下,想要用 Python 实现读取/imu/data话题、完成惯性导航航迹推算(含静态初始化),并在 RViz 中实时可视化位姿轨迹一、环境依赖编译# 核心ROS依赖 sudo apt-get install ros-melodic-ros-python ros-melodic-se…

破解银发学习痛点 兴趣岛 “普惠 + 品质” 模式打造积极老龄化范本

你以为 60 的退休生活,就是围着孙子、灶台打转,或是在广场舞的旋律里消磨时光?有这样 50 多位平均年龄超 60 岁的乐龄歌者,用一场专业舞台的音乐会给出了不一样的答案。1 月 16 日晚,广州南越 SYNT 演艺中心温情涌动&…

flask基于python的在线课程学习平台

目录基于Flask的Python在线课程学习平台摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!基于Flask的Python在线课程学习平台摘要 Flask作为轻量级Python Web框架,以其灵活性…

肾脏超声图像质量评估与分类系统实现(附Mask R-CNN模型训练)_1

1. 肾脏超声图像质量评估与分类系统实现(附Mask R-CNN模型训练) 1.1. 摘要 本文详细介绍了一个基于深度学习的肾脏超声图像质量评估与分类系统的实现过程。系统采用Mask R-CNN作为核心模型,通过对肾脏超声图像进行质量评估和分类,…

2026人参粉选购指南:从“百草之王”到“品质之选”-神象18年林下山参粉 - 行业调研院

《神农本草经》将人参列为“上品”,称其“主补五脏,安精神,定魂魄,止惊悸,除邪气,明目,开心益智”。作为传承千年的“滋补圣品”,人参至今仍是国人调理身体的首选——但如今快节奏的生活里,没人有时间熬参汤、…

java学习笔记1.5

Day05 方法: 程序中的独立功能,也是最小的执行单元使用场景:经常使用的代码打包,放在方法中。好处:提高了程序的复用性和可维护性 核心:接受数据->计算结果->返回结果 int getSum (int a,int b){ //接…

flask基于Python的智能购物电商平台商城

目录摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 随着电子商务的快速发展,智能购物平台的需求日益增长。基于Python的Flask框架开发的智能购物电商平台,…

深度学习毕设选题推荐:基于python-CNN深度学习识别猫脸

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…