中国建设银行培训网站网站素材图

news/2025/9/24 7:35:06/文章来源:
中国建设银行培训网站,网站素材图,可以做砍价活动的网站,网站制作百度前置概念 偏差 指模型的预测值与真实值之间的差异#xff0c;它反映了模型的拟合能力。 方差 指模型在不同的训练集上产生的预测结果的差异#xff0c;它反映了模型的稳定性。 方差和偏差对预测结果所造成的影响 在机器学习中#xff0c;我们通常希望模型的偏差和方差都…前置概念 偏差 指模型的预测值与真实值之间的差异它反映了模型的拟合能力。 方差 指模型在不同的训练集上产生的预测结果的差异它反映了模型的稳定性。 方差和偏差对预测结果所造成的影响 在机器学习中我们通常希望模型的偏差和方差都能够尽可能地小从而达到更好的泛化能力。但是偏差和方差的平衡是一个非常复杂的问题很难通过简单的调参来解决。因此在实际应用中我们需要综合考虑模型的鲁棒性、准确性和泛化能力等多个指标来评估模型的性能和可靠性。 鲁棒性 指模型对于输入数据中的噪声、异常值、缺失值等干扰因素的抵抗能力。在机器学习中我们通常希望模型能够对于不同的输入数据都能够产生稳定和一致的输出结果我们可以通过数据清洗、特征选择、模型调参等方法来提高模型的鲁棒性从而提高模型的性能和准确性。 鲁棒性 集成学习 核心思想是训练出多个模型并将这些模型进行组合。根据分类器的训练方式和组合预测的方法。目标就是减少机器学习模型的方差和偏差找到机器学习模型在欠拟合和过拟合之间的最佳平衡点。集成学习中两种最重要的方法就是降低偏差的 Boosting 和降低方差的Bagging。 Boosting 方法 有三种很受欢迎的算法分别是 AdaBoost、GBDT 和 XGBoost AdaBoost 它通过持续优化一个基模型将新模型整合到原有模型中并对样本进行加权以减小模型预测误差。 GBDT梯度提升决策树 将梯度下降和 Boosting 方法结合的算法。它采用决策树模型并定义一个损失函数通过梯度下降来优化模型。 XGBoost极端梯度提升 对 GBDT 进一步优化的算法。它也采用决策树模型并定义一个损失函数。与 GBDT 不同的是XGBoost 利用泰勒展开式将损失函数展开到二阶并利用二阶导数信息加快训练集的收敛速度 Bagging方法 是一种降低模型方差的集成学习方法它通过随机抽取数据的方式构建多个基模型并将它们的结果进行集成从而得到一个泛化能力更强的模型。Bagging方法有三种常见的算法 决策树的Bagging 这种方法是基于决策树的Bagging也称为树的聚合Bagging of Tree。它的基本思想是通过随机抽取数据和特征构建多棵决策树并将它们的结果进行集成。决策树具有显著的低偏差、高方差的特点因此通过Bagging方法可以降低模型方差提高模型的泛化能力。 随机森林算法 随机森林算法是一种基于决策树的Bagging方法它在决策树的基础上引入了随机特征选择。具体来说随机森林算法在每个节点上随机选择一部分特征进行划分从而降低模型方差提高模型的泛化能力。 极端随机森林算法 极端随机森林算法是一种基于决策树的Bagging方法它在随机森林算法的基础上进一步引入了随机特征和随机阈值选择。具体来说极端随机森林算法在每个节点上随机选择一部分特征和一个随机阈值进行划分从而进一步降低模型方差提高模型的泛化能力。 具体应用 “易速鲜花”运营部门提出了两个裂变思路。 方案一是选择一批热销商品让老用户邀请朋友扫码下载 App 并成功注册朋友越多折扣越大。我们把这个方案命名为“疯狂打折”它走的是友情牌。 方案二是找到一个朋友一起购买第二件商品就可以免费赠送这叫“买一送一”。 具体来说方案一是让老用户邀请朋友扫码下载 App 并成功注册朋友越多折扣越大。 输入的数据集 我们今天的目标就是根据这个数据集来判断一个特定用户在特定的裂变促销之下是否会转化。 预测代码如下 import pandas as pd #导入Pandas from sklearn.metrics import f1_score from sklearn.tree import DecisionTreeClassifierdf_fission pd.read_csv(易速鲜花裂变转化.csv) #载入数据 df_fission.head() #显示数据import matplotlib.pyplot as plt #导入pyplot模块 import seaborn as sns #导入Seaborn fig sns.countplot(是否转化, datadf_fission) #创建柱状计数图 fig.set_ylabel(数目) #Y轴标题 plt.show() #显示图像# 把二元类别文本数字化 df_fission[性别].replace(女,0,inplace True) df_fission[性别].replace(男,1,inplaceTrue) # 显示数字类别 print(Gender unique values,df_fission[性别].unique()) # 把多元类别转换成多个二元哑变量然后贴回原始数据集 df_fission pd.get_dummies(df_fission, drop_first True) df_fission # 显示数据集X df_fission.drop([用户码,是否转化], axis 1) # 构建特征集 y df_fission.是否转化.values # 构建标签集 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test train_test_split(X,y,test_size 0.2) from sklearn.preprocessing import MinMaxScaler #导入归一化缩放器 scaler MinMaxScaler() #创建归一化缩放器 X_train scaler.fit_transform(X_train) #拟合并转换训练集数据 X_test scaler.transform(X_test) #转换测试集数据# 一、测试准确率是指在测试集上分类器正确分类的样本数占总样本数的比例。它是分类器性能的一个重要指标但是它不能很好地反映分类器在不同类别上的表现。 # #二、 F1分数是精确率和召回率的调和平均数它综合了分类器的精确率和召回率是一个更全面的分类器性能指标。 # 精确率是指分类器正确预测为正例的样本数占预测为正例的样本数的比例召回率是指分类器正确预测为正例的样本数占实际为正例的样本数的比例。F # 1分数越高表示分类器的性能越好。#1.1 AdaBoost算法 from sklearn.ensemble import AdaBoostClassifier # 导入AdaBoost 模型 dt DecisionTreeClassifier() # 选择决策树分类器作为AdaBoost 的基准算法 ada AdaBoostClassifier(dt) # AdaBoost 模型 ada.fit(X_train, y_train) # 拟合模型 y_pred ada.predict(X_test) # 进行预测 print(AdaBoost 测试准确率: {:.2f}%.format(ada.score(X_test, y_test)*100)) print(AdaBoost 测试F1分数: {:.2f}%.format(f1_score(y_test, y_pred)*100))# 1.2 GBDT算法 from sklearn.ensemble import GradientBoostingClassifier # 导入梯度提升模型 gb GradientBoostingClassifier() # 梯度提升模型 gb.fit(X_train, y_train) # 拟合模型 y_pred gb.predict(X_test) # 进行预测 print( 梯度提升测试准确率: {:.2f}%.format(gb.score(X_test, y_test)*100)) print( 梯度提升测试F1分数: {:.2f}%.format(f1_score(y_test, y_pred)*100))#1.3 XGBoost算法 from xgboost import XGBClassifier # 导入XGB 模型 xgb XGBClassifier() # XGB 模型 xgb.fit(X_train, y_train) # 拟合模型 y_pred xgb.predict(X_test) # 进行预测 print(XGB 测试准确率: {:.2f}%.format(xgb.score(X_test, y_test)*100)) print(XGB 测试F1分数: {:.2f}%.format(f1_score(y_test, y_pred)*100))#2.1 决策树的Bagging from sklearn.ensemble import BaggingClassifier # 导入Bagging 分类器 from sklearn.tree import DecisionTreeClassifier # 导入决策树分类器 from sklearn.metrics import (f1_score, confusion_matrix) # 导入评估指标 dt BaggingClassifier(DecisionTreeClassifier()) # 只使用一棵决策树 dt.fit(X_train, y_train) # 拟合模型 y_pred dt.predict(X_test) # 进行预测 print( 决策树测试准确率: {:.2f}%.format(dt.score(X_test, y_test)*100)) print( 决策树测试F1 分数: {:.2f}%.format(f1_score(y_test, y_pred)*100)) bdt BaggingClassifier(DecisionTreeClassifier()) # 树的Bagging bdt.fit(X_train, y_train) # 拟合模型 y_pred bdt.predict(X_test) # 进行预测 print( 决策树Bagging 测试准确率: {:.2f}%.format(bdt.score(X_test, y_test)*100)) print( 决策树Bagging 测试F1分数: {:.2f}%.format(f1_score(y_test, y_pred)*100))#2.2 随机森林算法 from sklearn.ensemble import RandomForestClassifier # 导入随机森林模型 rf RandomForestClassifier() # 随机森林模型 rf.fit(X_train, y_train) # 拟合模型 y_pred rf.predict(X_test) # 进行预测 print( 随机森林测试准确率: {:.2f}%.format(rf.score(X_test, y_test)*100)) print( 随机森林测试F1分数: {:.2f}%.format(f1_score(y_test, y_pred)*100))#2.3 极端随机森林算法 from sklearn.ensemble import ExtraTreesClassifier # 导入极端随机森林模型 ext ExtraTreesClassifier() # 极端随机森林模型 ext.fit(X_train, y_train) # 拟合模型 y_pred ext.predict(X_test) # 进行预测 print( 极端随机森林测试准确率: {:.2f}%.format(ext.score(X_test, y_test)*100)) print( 极端随机森林测试F1分数: {:.2f}%.format(f1_score(y_test, y_pred)*100)) 图中可以看出对于这个问题XGBoost、随机森林和极端随机森林都是比较好的选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/915216.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

宏润建设集团网站手机网页游戏排行榜前十名

文章目录 背景分析 问题来了比较一开始的情况解决方式 背景 之前有分析过一次类似问题,最终结论是在keyby之后,其中有一个key数量特别庞大,导致对应的subtask压力过大,进而使得整个job不再继续运作。在这个问题解决之后&#xff…

福建省高速公路建设管理网站软件开发工具和环境

重点 更多前端知识 诚邀各位前端从事者爱好者加入前端大佬技术交流社区,本社区主要分享技术栈、个人心得、技术交流、问题解惑等前端体系交流 点击下方文字加入 前端大佬技术交流社区 1. 函数的定义和调用 1.1 函数的定义方式 方式1 函数声明方式 function 关键…

包小盒设计网站wordpress手机版主题无效

简单工厂模式描述的是,通过类的继承关系,父类(工厂类)与子类(产品类),调用父类中的方法,实际干活儿的是子类中的方法;封装需求的不确定性,做出通用的编程&…

德阳网站建设优化阳朔到桂林北

2558. 从数量最多的堆取走礼物 原题地址: 力扣每日一题:从数量最多的堆取走礼物 给你一个整数数组 gifts ,表示各堆礼物的数量。每一秒,你需要执行以下操作: 选择礼物数量最多的那一堆。 如果不止一堆都符合礼物数量最…

开网站做代销好网站根目录 本地共享

jarsigner, keytool 这2个都是JDK的内置工具,在JDK的bin目录中可以找到, 下面是使用jarsigner给jar文件签名的5个步骤: 1. 使用java的jar工具创建JAR文件; # 将当前文件夹下的所有文件打包到myapp-1.0.jar文件中 后面的*为通配符, 也可以指定需要打包的jar中的文件或者文件夹…

苏州网站开发外包公司免费ppt模板下载公众号

应用场景 上一篇《Spring Cloud Stream消费失败后的处理策略(一):自动重试》介绍了默认就会生效的消息重试功能。对于一些因环境原因、网络抖动等不稳定因素引发的问题可以起到比较好的作用。但是对于诸如代码本身存在的逻辑错误等&#xff…

做网站公司哪家正规古楼角网站建设

2019独角兽企业重金招聘Python工程师标准>>> 由于最近用阿里云日志服务整合log4j,在配置com.aliyun.openservices.log.log4j.LoghubAppender需要设置一些参数,因为项目中有统一的配置文件,所以想要可以直接在log4j.xml中通过${}来…

2025年国家科技奖初评公布(科技发明奖)

微信视频号:sph0RgSyDYV47z6快手号:4874645212抖音号:dy0so323fq2w小红书号:95619019828B站1:UID:3546863642871878B站2:UID: 3546955410049087 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过 140 …

做网站的收入上海平台网站建设

SQL Server横向扩展方案-SODA每次在提到SQL Server扩展性问题的时候,似乎很多的SQL Server DBA或者使用微软技术开发的朋友心里总是一整痛:SQL Server只能纵向的扩展(Scaling-Up),无法横向的扩展(Scaling-Out)。每次有人提到Oracle和SQL Serv…

wordpress替代广州网站优化公司

对于前端来说,2023 是非同寻常的一年。我们见证了争相抢占甚至是发明服务器端渲染(SSR)市场的热潮、AI 的不断进步、Web 渲染器和 JS 引擎的寒武纪大爆发、一大批有力的竞争者试图摧毁巨头的统治地位…… 在开始预测未来一年发展趋势之前&am…

推荐系统网站开发徐州做网站企业

本次以多台机器需部署zabbix客户端为例: 机器先做免密互信,ansible主机上执行ssh-keygen,一路回车,然后将公钥发送给需管理的主机: ssh-copy-id rootIP 1、编辑hosts文件,添加需配置的主机IP,并测试连通…

最好的自助建站系统wordpress forest

在上一节中,我们简单讲述了数据库和SQL的基本概念。 本节我们讲述一下环境搭建,为下一节讲表的基本操作做下铺垫。 环境搭建 具体到操作,我们就要准备一些环境了。如果不进行练习,我们学习的知识将很快被遗忘。 MySQL安装&…

大岭山镇仿做网站廊坊网站建设-纵横网络+网站

海龟编辑器是一款专为广大少儿打造的Python编辑器,该软件功能强大且使用便利,可以帮助孩子们以搭积木的方式来学习Python,并且支持Python代码和图形化积木的双向互相转译,不但可以有效提升孩子的学习兴趣,而且还能够降…

局网站建设招标深圳网站建设 卓

多Transformer的双向编码器表示法 Bidirectional Encoder Representations from Transformers,即Bert; 第二部分 探索BERT变体 从本章开始的诸多内容,以理解为目标,着重关注对音频相关的支持(如果有的话)…

html5手机app网站模板免费下载网络网页制作

我们在开发中经常会用到一些指定区域进行打印机打印,但是使用常规方式打印会将全部页面打印,当然相同都为打印,但是打印出来的内容并不是我们需要的东西,进行给大家分享如何设置打印机指定区域进行打印;该标签中的内容…

网站 编程语言建站论坛

Oracle从入门到总裁:​​​​​​https://blog.csdn.net/weixin_67859959/article/details/135209645 主键约束可以看成是非空约束再加上唯一约束 也就是说设置为主键列,不能为空,不能重复 像一般用户编号是不可能重复的,也不可能为空的 …

网站备备份教程上海集锦信息科技有限公司

目录 概述 1 STM32H750 HSE时钟介绍 2 使用STM32Cube创建Project 3 认识HSE时钟 3.1 HSE时钟的特性 3.2 HSE的典型应用电路 4 STM32Cube中配置时钟 4.1 时钟需求 4.2 配置参数 4.2.1 使能外围资源 4.2.2 使用STM32Cube注意项 4.2.3 配置参数 5 总结 概述 本文主要…

九江市建设规划局旧网站网站优化+山东

来源:集智俱乐部 作者:斯蒂芬沃尔夫勒姆 数学家、物理学家、计算机科学家导语:圣塔菲研究所被誉为复杂性科学的圣地,被称为“没有围墙的研究所”,那么它是如何创建发展起来的呢?2019 年,为了纪…

网站首页优化的目的wordpress旧文章更新

概述 当用户打开、切换和返回到对应应用时,应用中的UIAbility实例会在其生命周期的不同状态之间转换。UIAbility类提供了一系列回调,通过这些回调可以知道当前UIAbility实例的某个状态发生改变,会经过UIAbility实例的创建和销毁,…

周至县做网站上海企业建站推荐

使用数据库的时候,我们可以用JDBC来实现mysql数据库与java程序之间的通信,为了提高通信效率,我们有了数据库连接池比如druid等等。而我们想通过Java程序控制redis,同样可以借助一些工具来实现,这就是redis客户端&#…