创办一个网站如何自己建造网站

web/2025/10/8 3:24:23/文章来源:
创办一个网站,如何自己建造网站,湖南省建设监理协会官网,赛博网站建设四川一、传统机器学习分类流程与经典思想算法简述 传统机器学习是指#xff0c;利用线性代数、数理统计与优化算法等数学方式从设计获取的数据集中构建预测学习器#xff0c;进而对未知数据分类或回归。其主要流程大致可分为七个部分#xff0c;依次为设计获取数据特征集#x…一、传统机器学习分类流程与经典思想算法简述 传统机器学习是指利用线性代数、数理统计与优化算法等数学方式从设计获取的数据集中构建预测学习器进而对未知数据分类或回归。其主要流程大致可分为七个部分依次为设计获取数据特征集特征构造和特征提取、探索性地对数据质量分析评价、数据预处理、数据集划分、机器学习算法建模学习器选择、特征筛选与参数调优、任务选择分类或回归和精度评价与泛化性评估设计获取数据特征集和机器学习算法建模是机器学习最为重要且关键的部分。 传统机器学习的主要特征为需要人为设计定义数据特征并利用传统机器学习算法进行模型训练和通常受到数据量的限制。为缓解传统机器学习的大数据训练局限性往往采用增量方式进行学习。常见的传统机器学习算法包括线性回归、逻辑回归、决策树、支持向量机、朴素贝叶斯、K最近邻等而基于集成学习模型融合、弱分类器集成和混合专家模型、Bagging和Boosting思想又涌现出了随机森林、极端梯度提升和其它强大组合学习器等机器学习算法。 图一 传统机器学习通用流程图示 二、集成学习简述 1、集成学习定义[5] 模型集成和集成学习是相同的概念。它们都指的是将多个机器学习模型组合在一起以提高预测的准确性和稳定性的技术。通过结合多个模型的预测结果集成学习可以减少单个模型的偏差和方差并提供更可靠的预测结果。 2、集成学习的主要研究方向[7] 模型融合。模型融合在最初的时候被称为“分类器结合”这个领域主要关注强评估器试图设计出强大的规则来融合强分类器的结果以获取更好的融合结果。这个领域的手段主要包括了投票法Voting、堆叠法Stacking、混合法Blending等且被融合的模型需要是强分类器。 弱分类器集成。弱分类器集成主要专注于对传统机器学习算法的集成这个领域覆盖了大部分我们熟悉的集成算法和集成手段如装袋法bagging、提升法boosting。这个领域试图设计强大的集成算法来将多个弱学习器提升为强学习器。 混合专家模型mixture of experts。混合专家模型常常出现在深度学习神经网络的领域。在其他集成领域当中不同的学习器是针对同一任务、甚至在同一数据上进行训练但在混合专家模型中我们将一个复杂的任务拆解成几个相对简单且更小的子任务然后针对不同的子任务训练个体学习器专家然后再结合这些个体学习器的结果得出最终的输出。 三、基于scikit-learn和XGBoost机器学习库的分类器构建 scikit-learn机器学习库的运算均在CPU上实现且具有大数据量限制而XGBoost库是GPU并行计算的工程实现库。XGBoost库可以实现在GPU上进行基于随机森林和极致梯度提升算法的分类训练任务。 1、决策树 # 决策树生成及训练 clf tree.DecisionTreeClassifier(criterionentropy #{gini,entropy,log_loss}不纯度计算方法# ,random_state4 #固定随机种子从而可复现这棵决策树,max_depth7 #{None,int}决策树可生长的最大深度,max_featuresNone #{None,int,float,sqrt,log2}分枝时所参与考虑的最大特征个数,min_samples_leaf1 #{1int or float}分枝会向着满足每个子节点至少都包含设定值个样本的方向去发展float[0,1]会作为比率乘以样本数,splitter best #{best,random} 每一个节点分裂的方法。“best”会优先选择更重要的特征进行分枝“random”在分枝时更加随机树会更深,min_impurity_decrease0.0 #{0.0float}若节点不纯度大于等于该值则必须再次进行节点分裂,max_leaf_nodesNone #{Noneint}设置决策树只能生长出的最大叶子节点数,class_weightNone #{None,balanced,dict {0:weight0,1:weight1,2:weight2,3:weight3} 以四分类为例列表索引为类别标签#使用class_weight参数对样本标签进行一定均衡给少量的标签更多的权重调整损失函数让模型更偏向少数类向捕获少数类的方向建模,min_weight_fraction_leaf0.0 #{0,0,float}min_weight_fraction_leaf搭配class_weight使用) clf clf.fit(Xtrain,Ytrain) 2、随机森林 # 基于scikit-learn实现随机森林分类器 clf ensemble.RandomForestClassifier(n_estimators50,random_state0,criteriongini,max_depth8,max_featuresNone,min_impurity_decrease0,min_samples_split2,n_jobs-1,bootstrapTrue,oob_scoreFalse) clf clf.fit(Xtrain,Ytrain) # 基于XGBoost库实现随机森林分类器 RF_param {booster:gbtree #随机森林必须设置为gbtree,num_parallel_tree:40 #相当于n_estimators即森林的树数量,max_depth:8 ,subsample: 0.8 #训练集采样,eta:1 #随机森林必须设置为1,objective:multi:softmax,num_class:7,colsample_bytree:0.8 #{default1(01]}在建立提升树时对特征采样的比率,colsample_bylevel:0.8 #{default1(01]}在树的每一层级所考虑的特征采样比率,colsample_bynode:0.8 #{default1(01]}在树的每一节点需要分枝时所考虑的特征采样比率,tree_method:hist,device:cuda,verbosity:0 #在训练过程中不打印信息# random_state:0 #为了随机森林模型可复现可以添加该参数} # 训练迭代次数 num_boost_round 1 #随机森林必须设置为1防止变为提升随机森林 RF_train xgb.DMatrix(X,Y) RF_bst_model xgb.train(RF_param,RF_train,num_boost_round) 3、极致梯度提升 hyper_param { booster:dart #提升方法选择{gbtree,gblinear,dart}default为gbtree,objective:multi:softmax #优化目标函数可参考https://blog.csdn.net/weixin_41990278/article/details/90945550,num_class:7 # 若objective:multi:softmax则需要该参数搭配使用以明确分类类别数,max_depth:14 #对模型影响起到重要作用,gamma:0 #{default0}gamma参数与max_depth相互影响该参数表示在树的叶子节点上进一步再分枝所需的最小减少损失,eta:0.4946027456790744 #{default0.3}模型提升学习率,subsample: 0.7322769765320624 #训练集的采样比例(即用于训练模型的子样本占整个样本集合的比例),sampling_method:uniform #{defaultuniform}采样方式有uniform、subsamplegradient_based,colsample_bytree:0.8296436370552397 #{default1(01]}在建立提升树时对特征采样的比率,colsample_bylevel:0.9324152350516648 #{default1(01]}在树的每一层级所考虑的特征采样比率,colsample_bynode:0.7855729164259361 #{default1(01]}在树的每一节点需要分枝时所考虑的特征采样比率,lambda:0.00021262200589351114 #{default1}权重的L2正则项,alpha:3.481194252535334e-06 #{default1}权重的L1正则项,tree_method:auto #{defaultauto}构造树的方法,{exact,approx,histauto},max_leaves:0 #{default0}树的最大叶子节点数量不可用于tree method exact,device:cuda #缩短运算时间将验证训练放置于GPU上训练,nthread:-1 #运行训练器的并行线程数本机满线程则设置为-1# ,scale_pos_weight:1 #{default1}控制正负样本比例用于数量不平衡数据集# ,grow_policy:depthwise #{defaultdepthwise,lossguide}控制节点生长的方式须在tree method hist or approx下使用# ,seed:0 #可复现模型的参数随机种子# ,num_parallel_tree:1 # 每一次训练迭代所构建的树的数量# ,verbosity:0 #[03]训练中是否打印每次训练的信息.0-不打印1-warning2-info3-debug}# 开始训练 xy_train xgb.DMatrix(X,Y) num_boost_round 70 bst_model xgb.train(hyper_param,xy_train,num_boost_round) API使用文档 /*1*/ API reference — pandas 2.2.2 documentation /*2*/ NumPy reference — NumPy v1.26 Manual /*3*/ API Reference — scikit-learn 1.5.0 documentation /*4*/ XGBoost Tutorials — xgboost 2.0.3 documentationGPU计算并行化工程库 /*5*/ API Reference — Optuna 3.6.1 documentation超参数优化 /*6*/ PhiK — Phi_K correlation library documentationPhiK相关系数计算适用类别标签和间隔变量 参考资料 [1] (超爽中英!) 2024公认最好的【吴恩达机器学习】教程附课件代码 Machine Learning Specialization_哔哩哔哩_bilibili [2] 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结 [3] HF.048 I Nature帮你整理了最核心的统计概念和方法你确定不看看吗二 [4] 突破机器学习核心点特征工程 (qq.com) [5] 【机器学习】集成模型/集成学习多个模型相结合实现更好的预测-腾讯云开发者社区-腾讯云 (tencent.com) [6] 随机森林Python实战_哔哩哔哩_bilibili [7] 【技术干货】集成算法专题XGBoost2022新版_哔哩哔哩_bilibili [8] 综述机器学习中的模型评价、模型选择与算法选择 (qq.com) [9] 机器学习8大调参技巧 (qq.com) [10] 机器学习中7种常用的线性降维技术总结 (qq.com) 参考论文 /**1**/ https://dl.acm.org/doi/pdf/10.1145/2939672.2939785(XGBoost) /**2**/ https://link.springer.com/content/pdf/10.1023/a:1010933404324.pdf /**3**/ http://www.cs.ecu.edu/~dingq/CSCI6905/readings/BaggingBoosting.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/88843.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站静态化对seowordpress get

一、赋值与引用 当你将一个变量赋值给另一个变量时,实际上是将一个对象的引用(内存地址)赋给了另一个变量,而不是创建了一个新的对象。因此,这两个变量将指向相同的内存地址,修改其中一个变量的值将会影响…

有免费可以做的网站吗网站空间在哪买好

我在整个屏幕上显示一个回收站视图,该回收站视图只有一个图像视图,我想知道如何在回收站适配器之外获取屏幕上显示的imageview的位置。我试图实现一个接口,但结果不准确。我想立即保存当前位置。我的回收站适配器:public class Re…

安徽省建设工程信息网官网是什么网站广告投放方式

北京的Java培训班有很多,价格却是相差不多的,但培训的课程就参差不齐了,有的培训班就是为了赚钱而存在的,想要系统的学习Java,确保学习效果,那么你一定要挑选正规的Java培训班,挑选适合自己的Ja…

线在成都网站推广公司什么网站的地图

Docker 为用户提供了在 Ubuntu Linux 上快速创建虚拟容器的能力。但是,那些不想使用命令行管理容器的人可以在 Ubuntu 24.04 LTS 上安装 Docker Desktop GUI,本教程将提供用于设置 Docker 图形用户界面的命令…… Docker Desktop 是一个易于使用的集成容…

网页设计专业学校优化网站排名如何

乘风破浪:LeetCode真题_010_Regular Expression Matching 一、前言 关于正则表达式我们使用得非常多,但是如果让我们自己写一个,却是有非常大的困难的,我们可能想到状态机,确定,非确定状态机确实是一种解决…

vps怎么搭建网站电子商务网站建设的首要问题

产品主要特点: -设备安装方便简洁,可通过3M胶直接将设备粘 贴到车前挡风玻璃上 -支持IE预览,手机,PAD实时预览, 支持电脑客 户端实时预览功能 -内置2路模拟高清, 每路均可达到200万像素。另 外可扩充2路1080P模拟…

有限公司网站入口佛山网站建设公司哪家比较好

目录 组件介绍 组件声明结构 组件接口 script dependency template style 状态注入 接口声明 组件介绍 Component 扩充自 Vue 的组件, 提供了 Vue 组件对等的输入参数能力。在代码书写时提供类 class 的装饰器 Decorator 风格。 import { Component, Watch } from al…

外贸网站模板 外贸网站制作龙岗微信网站制作

在 linux上安装 Redis 可以按照以下步骤进行(此处用Ubuntu 服务器进行讲解): 步骤 1: 更新系统包 打开终端并运行以下命令以确保你的系统是最新的: sudo apt update sudo apt upgrade步骤 2: 安装 Redis 使用 apt 包管理器安装 Redis: s…

dede网站安全设置合肥网络推广软件系统

目录 Python基础(二)--数据类型,运算符与流程控制 1 数据类型 1.1 Python中的数据类型 1.2 整数类型(int) 1.3 布尔类型 1.4 浮点类型 1.5 复数类型 1.6 类型转换 2 运算符 2.1 算术运算符 2.2 布尔运算符 …

深圳北站网站建设南京江北新区

ORACLE行转列、列转行实现方式及案例 行转列案例方式1.PIVOT方式2.MAX和DECODE方式3.CASE WHEN和GROUP BY 列转行案例方式1.UNPIVOT方式2.UNION ALL 行转列 案例 假设我们有一个名为sales的表,其中包含了产品销售数据。表中有三列:product(…

丑陋网站设计赏析事业单位网站建设费入什么科目

智慧公厕作为城市基础设施的重要组成部分,正逐渐成为改善城市品质和提升居民生活体验的一项关键措施。通过智能化管理、数字化使用和信息化运行,智慧公厕不仅可以为城市居民带来更舒适便利的使用体验,而且对于城市的高质量发展、宜居性和包容…

网站宣传推广策划长春建站模板源码

本文内容,全部选自自动化考研联盟的:《25届中国矿业大学868自控考研资料》的真题篇。后续会持续更新更多学校,更多年份的真题,记得关注哦~ 目录 2007年复试真题 2023年初试真题 Part1:完整版真题 2007年复试真题 2…

网站后台模板论坛qq网站 直接登录

偷得几日清闲,又因一瞬之间对蹉跎时间的愧疚,由此而来到CSDN这个高手云集和新手求学的平台来也写上那么一篇博客。虽然自己的博客那么久不温不热,但坚持写作,巩固自己就好。今天要讲的是续接上一篇文章的补充与继续吧。上期文章&a…

网站基础三要素wordpress th7

要在WordPress中为不同的分类添加特定的字段,您可以使用自定义字段(Custom Fields)功能。以下是一种方法,通过编写自定义的函数来实现。 首先,您需要创建一个自定义的函数来添加特定的字段。您可以在WordPress主题的f…

宝安做网站的公司枣庄建设工程管理局网站

文章目录1. 题目2. 解题2.1 超时解2.1 改进计算方法1. 题目 假设你设计一个游戏,用一个 m 行 n 列的 2D 网格来存储你的游戏地图。 起始的时候,每个格子的地形都被默认标记为「水」。 我们可以通过使用 addLand 进行操作,将位置 (row, col)…

网站设计范文徐州 商城网站

文章目录1. 题目2. 解题1. 题目 你打算用一个水罐给花园里的 n 株植物浇水。 植物排成一行,从左到右进行标记,编号从 0 到 n - 1 。其中,第 i 株植物的位置是 x i 。x -1 处有一条河,你可以在那里重新灌满你的水罐。 每一株植…

做招聘网站高端企业网站建设费用

在电脑UC浏览器的新窗口页中如何打开书签UC浏览器是一个很不错的查询资料的软件,我们可以在UC浏览器的新标签页中打开书签,那么如何打开呢?小编就来为大家介绍一下吧。具体如下:1. 第一步,双击并打开UC浏览器软件。2. …

网站个人建设河北做网站公司那家好

要从PDF文件中提取数据并生成数据库,你可以使用Python中的一些库和工具来实现。 1、安装必要的库:确保已安装所需的库。除了之前提到的PyPDF2、pdfminer.six和pdftotext之外,你可能还需要其他的库来处理提取的数据和数据库操作。例如&#x…

wordpress做下载站中国商标网官方查询系统

theme: smartblue 点赞 关注 收藏 学会了 本文简介 最近字节在推Coze,你可以在这个平台制作知识库、制作工作流,生成一个具有特定领域知识的智能体。 那么,有没有可能在本地也部署一套这个东西呢?这样敏感数据就不会泄露了&…

河北邯郸信息港济南网站建设优化

文章目录 简介原理依赖基础示例功能解析和遍历文档输入从字符串中解析文档从 URL 加载文档从文件加载文档 数据提取使用 DOM 方法导航文档使用 CSS 选择器查找元素使用 XPath 选择器查找元素和节点从元素中提取属性、文本和 HTML 清理HTML 官网: https://jsoup.org…