关掉wordpress站点图片seo优化是什么意思

diannao/2026/1/16 7:29:25/文章来源:
关掉wordpress站点,图片seo优化是什么意思,北京的电商平台网站有哪些内容,社交网站开发项目计划报告机器学习#xff1a;从源数据清洗到特征工程建立谈金融反欺诈模型训练 本文旨在通过一个完整的实战例子#xff0c;演示从源数据清洗到特征工程建立#xff0c;再到模型训练#xff0c;以及模型验证和评估的一个机器学习的完整流程。由于初识机器学习#xff0c;会比较多的…机器学习从源数据清洗到特征工程建立谈金融反欺诈模型训练 本文旨在通过一个完整的实战例子演示从源数据清洗到特征工程建立再到模型训练以及模型验证和评估的一个机器学习的完整流程。由于初识机器学习会比较多的困惑希望通过借助这个实战的例子可以帮助大家对机器学习了一个初步的认识。 本文旨在通过一个完整的实战例子演示从源数据清洗到特征工程建立再到模型训练以及模型验证和评估的一个机器学习的完整流程。由于初识机器学习会比较多的困惑希望通过借助这个实战的例子可以帮助大家对机器学习了一个初步的认识。 【数据来源】 本文的数据来源于Lending Club网站的公开数据数据集为自LendingClub平台发放的2016年Q3的总计99122条贷款记录。 Lending Club是美国最大的P2P网贷交易平台利用网络技术直接连接了个人投资者和个人借贷者缩短资金流通的细节绕过传统的大银行等金融机构使得投资者和借贷者都能得到更多实惠。对于投资者来说可以获得更好的回报;对于借贷者来说则可以获得相对较低的贷款利率。 在借贷行业中投资者向借贷者提供贷款以获取利息。如果借贷者顺利偿还贷款投资者则获得利息收益。如果借贷者无法偿还贷款投资者则损失贷款本金。因此对于投资者来说需要预测借贷者无法偿还贷款的风险最大程度地避免投资损失最大程度地实现投资回报。 【实施步骤】 一、 总体流程说明 数据分析的开始是从了解你要分析的数据以及了解你本次机器学习的目标开始的。需要分清是分类问题还是回归问题同时需要了解数据的构造哪些是自变量(特征)哪个是因变量(目标变量)。就本次目标来看因为目标变量是loan_statas(还款状态)它是一个标称值因此本次是一个分类问题。 进入数据清洗阶段主要是去除一些缺失严重的样式或者特征同时去除一些跟业务无关的特征以及方差比较小的特征。建立特征工程时主要是对里面字符特征进行处理将其转成数值型以及对一些数据值特征进行归一化等处理;模型训练时主要是选择合适的算法以及选择合适的超参数;模型评估就是将在训练集上运行好的模型在测试集上进行验证评估。 二、了解数据集 使用pandas读取数据集然后查看数据信息         可以看出一共包含了99122条记录一共有121个特征和一个目标变量这些列的类型分布float64有97个字符型有25个。 三、 数据清洗 ▲取出特征X以及目标变量y     其中load_data是自己封装的一个函数用于根据targetCol来分割原来的df。 ▲根据业务去掉不需要的列 目前主要包含:无关的标识字段以及贷后字段     ▲调用自定义函数进行清理     主要包含的以下操作 ▪ 去除所有行以及所有的列均为nan的数据▪ 去除缺失率高的特征,这里超过0.9则不考虑▪ 去除特征中包含实例类别太多的特征默认包含1000个实例则不考虑▪ 对于数值型如果标准差太小的则不考虑该特征 可以从打印出的日志上看出经过上一步的清洗步骤已经从原来的121个特征变量降成75个特征变量。 再看一下清洗完后目前的特征中样本缺失度情况     由图可以目前缺失最高的mths_since_last_record在80%左右在预设范围内整体情况还相对理想。 ▲查看特征的相关程度 如果特征之间相关度比较高的话那就会影响分析结果这里对这些特征的相关度进行排序     从上述的相关系数的关联情况可以看出:funded_amnt,loan_amnt,funded_amnt_inv这几个特征的关联比较强仅保留funded_amnt去除其它两个特征经过清洗后只剩下了73个特征。 四、特征工程 ▲对目标变量的处理 查看目标变量y的值的分布情况     根据业务来理解Current和Fully Paid用户是属于信用良好的样本用1表示Late (31-120 days)和Late (16-30 days)逾期的用户就归于信用不好的样本用0表示其它的几类就暂时用np.nan来代替,本次暂时不分析先删除这些空的3912个样本。 处理完后目标变量的分布如下     ▲对字符型特征的处理 查看当前特征中字符型的特征主要包含     通过数据的分布可以看出特征pymnt_planapplication_type分布很不均衡暂时不考虑这两个特征。 同时将init_rate转成float类型将emp_length处理成int类型对剩下的三个home_ownershipverification_statusinitial_list_status类型变量做独热编码,使用pd.get_dummies函数同时去除原始的那三个字段。 经过如上的处理将其全部字符型的特征转成了数值型。 ▲对整体数值型特征的处理 这里主要对缺失值处理使用每个特征的中位数进行缺失值填充。     到此已全部完成了特征工程的建立最终特征工程包含95210个样本以及 77特征建好的特征工程进入下一阶段的模型训练。 五、 模型训练 因为考虑到样本的不均衡性交叉验证的方法使用StratifiedShuffleSplit方式来划分样本同时学习器使用GBRT算法同时RandomizedSearchCV进行最优参数选择。目前只是设置了基本的参数     通过训练集的充分训练后得到目前GBRT最优的参数如下     然后使用这个最优的模型来对测试集进行预测:     这样我们就得到了测试集在这个模型中跑出来的结果y_predicted数组然后将它与y_test进行比对就可以对该模型进行评估具体的可以查看2.6小结的结果。 六、模型评估 ▲查看分类报告     可以看出整体平均的精确度和召回率和F1值还是可以的不过对于样本0的召回率和F1值为0可能需要进一步优化。 ▲查看学习曲线     学习曲线是一条关于样本个数和经验损失函数之间的曲线通过学习曲线可以看到关于偏差、方差用于改善机器学习算法的决策提供依据;从目前的曲线可以看出训练得分和测试得分基本稳定在0.972这个点相对来说比较理想。 【结论与展望】 本文只是简单的演示了一个完整的机器学习的流程重点在于突出机器学习的各个实施步骤对于整体的模型可能还有以下几点可以优化与完善 ▪ 如何更好的处理样本的不平衡性▪ 是否考虑其它的算法进行比对效果比如xgboost▪ 算法的超参数调优可以增加几个变量调优▪ 特征工程的建立还是稍微粗糙了些还是可以再细化(比如特征的组合特征的重要性排序数值型特征的归一化处理等) 转载于:https://www.cnblogs.com/ldt-/p/10236889.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/91533.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

集团酒店网站建设唯品会 只做特卖的网站

https://stackoverflow.com/questions/41364386/whats-the-difference-between-markforcheck-and-detectchanges转载于:https://www.cnblogs.com/chen8840/p/10573295.html

需要网站建设的人多吗海南网新闻最新消息今天

以下内容是本人在开发过程中实际验证过的一些固定写法,记录下来,方便自己后续开发过程中直接拷贝粘贴。 1、div 设置宽度自适应文本内容:设置 div 节点的 class 为下面 auto-adjust-text-width .auto-adjust-text-width {display: inline-b…

做外贸网站建设肉部网站建设包括哪些

介绍 在我以前的文章中,我介绍了NONSTRICT_READ_WRITE二级缓存并发机制。 在本文中,我将使用READ_WRITE策略继续本主题。 直写式缓存 NONSTRICT_READ_WRITE是一种通读缓存策略,可更新最终无效的缓存条目。 尽管这种策略可能很简单&#xff0…

seo做的比较好的网站的几个特征夜月直播免费下载

ubuntu安装zsh、oh-my-zsh及常用配置 目前,ubuntu默认的shell是bash,但还有一种shell,叫做zsh它比bash更加强大,功能也更加完善,zsh虽说功能强大,但是配置比较复杂导致流行度不是很高 但是好东西终究是好…

主办单位性质与网站名称不符我在某网站网站做代理

400V功率放大器是一台非常实用的讯号放大器,它具有体积小、重量轻及操作方便,较高的电压输出(400Vp-p)以及较大的输出电流(2.8Ap-p)等优点。 HAP-4001连续输出直流电流量最大值达到0.5 A,电压放大增益40倍&#xff0c…

西宁网站制作哪里好北京网站关键字优化

一、ES数据基础类型 1、数据类型 字符串 主要包括: text和keyword两种类型,keyword代表精确值不会参与分词,text类型的字符串会参与分词处理 数值 包括: long, integer, short, byte, double, float 布尔值 boolean 时间 date 数组 数组类型不…

台州网站优化公司一级a做爰片迅雷网站

首先下载python地址: https://www.python.org/downloads/release/python-361/下载页面中有多个版本: web-based installer 是需要通过联网完成安装的 executable installer 是可执行文件(*.exe)方式安装 embeddable zip file 嵌入式版本,可…

食品 药品 监督 网站 源码 php全球设计师知识更新服务平台

一、引入 多关键字排序:假如现在有一个员工表。要求按照薪资排序,薪资相同的员工按照年龄排序。 先按照年龄进行排序,再按照薪资进行稳定的排序 按照这种思路我们对[32,13,94,52,17,54,93]排序: 先比较十位数的数字大小&#…

招远建网站专业营销网站开发

v-model 简介 官网是这样解释 v-model 的 v-model 的功能是&#xff0c;实现数据的双向绑定【本质上是 :value 和 input 语法糖】 如果是表单元素&#xff0c;下面两种写法是一样&#xff0c;这时v-model就是语法糖&#xff0c;帮你简化了操作 <input v-model"messag…

网站网络服务器是什么情况wordpress+去掉阅读

语言&#xff1a;C语言软件&#xff1a;Visual Studio 2022笔记书籍&#xff1a;数据结构——用C语言描述如有错误&#xff0c;感谢指正。若有侵权请联系博主 一、线性表的逻辑结构 线性表是n个类型相同的数据元素的有限序列&#xff0c;对n>0&#xff0c;除第一元素无直接…

网站投资多少钱秦皇岛保障性住房官网

视频格式 关于视频格式的内容,在这里不进行赘述,详细学习可以参考视频格式 视频数据冗余 数据冗余的类型分为哪几种? 图像与视频在数字化过程,即模电转数电过程中会产生数据冗余。从数字信号的统计特征方面,一般将这些数据冗余分为空间冗余,时间冗余,信息熵冗余三大…

火烈鸟门户网站开发贸易类文章网站

迪米特法则的定义 迪米特法则也称为最少知识原则,一个对象应该对其他对象有最少的了解. 通俗的讲,一个类应该对自己需要耦合或调用的类知道的最少,被调用类的内部是如何复杂都和我没关系,我就知道你的这些public方法,我就调用这么多,其他的我一概不关心. 迪米特法则对类的低耦…

有注入漏洞的网站源码网站建设公司 未来

2024.3.15 题目来源我的题解方法一 记忆化搜索&#xff08;自顶向下&#xff09;方法二 动态规划&#xff08;自底向上&#xff09; 题目来源 力扣每日一题&#xff1b;题序&#xff1a;2312 我的题解 方法一 记忆化搜索&#xff08;自顶向下&#xff09; 用 f(x,y)表示当木…

站长统计软件沅江网站设计公司

过去一年&#xff0c;ChatGPT 和其他大语言模型&#xff08;LLMs&#xff09;的爆火也带动了向量数据库的发展。 许多用户在搭建检索增强生成&#xff08;RAG&#xff09;系统过程中选择了使用向量数据库 Zilliz Cloud &#xff0c;但 Zilliz Cloud 的功能不止于此&#xff0c;…

公司网站建设意见征集十堰网站搜索优化价格

转载自 学习 Spring Boot 知识看这一篇就够了 从2016年因为工作原因开始研究 Spring Boot &#xff0c;先后写了很多关于 Spring Boot 的文章&#xff0c;发表在技术社区、我的博客和我的公号内。粗略的统计了一下总共的文章加起来大概有六十多篇了&#xff0c;其中一部分是在…

做网站用啥软件好传奇世界页游

来源&#xff1a;http://u6.gg/sDMab前言每次都在网上看到别人说什么某某库性能是如何如何的好&#xff0c;碾压其他的库。但是百闻不如一见&#xff0c;只有自己亲手测试过的才是最值得相信的&#xff0c;本篇通过JMH来测试一下Java中几种常见的JSON解析库的性能。JSON不管是在…

网络网站推广首荐乐云seo计算机专业做网站运营

正题 题目大意 将nnn个数分为222个非空的集合&#xff0c;要求两个集合内数的乘积的gcdgcdgcd为111。求方案数 解题思路 拥有相同质因子的数一定要在同一组&#xff0c;枚举质因数然后将拥有的数都用并查集合并然后用联通块数量来求即可。 codecodecode #include<cstdio&…

网站被抄袭怎么投诉建设网站备案不通过怎么办

小波分析是近30年来发展起来的数学分支&#xff0c;是Fourier分析划时代发展的结果&#xff0c;由法国工程师Morlet首先提出&#xff0c;后广泛应用于信号处理、图像处理与分析、地震勘探、故障诊断、自动控制等领域&#xff0c;小波就是小的波形&#xff0c;所谓“小”是指它具…

品牌宣传型企业网站网站推广到底应该怎么做

分析原因 众所周知&#xff0c;在JavaScript中计算两个十进制数的和&#xff0c;有时候会出现令人惊讶的结果&#xff0c;主要原因是计算机将数据存储为二进制所引起的&#xff0c;所以这并不是javascript存在的缺陷&#xff0c;而在其他语言中也有类似的问题。 例如下面的例子…

网站分析软件phpwind wordpress

说明 在开发中分页功能几乎是必不可少的一项功能&#xff0c;使用beego框架开发时&#xff0c;就遇到了分页功能的需求。可能是之前版本并不支持&#xff0c;我发现有很多自己实现的分页功能的封装&#xff0c;在阅读了官方源码时&#xff0c;我发现了分页功能的封装&#xff0…