网站建设价格差异多少wordpress月亮花园

web/2025/9/29 2:35:50/文章来源:
网站建设价格差异多少,wordpress月亮花园,内蒙建设厅网站,建设网站龙华文 | 水哥源 | 知乎Saying1. 小的性能差异在容易实现面前一文不值#xff0c;这一点是XGBoost和LightGBM的最大优势2. 没能与embedding很好地结合无疑是树模型的灾难#xff0c;吃不下巨量的新数据#xff0c;也打不过DNN#xff0c;除了一些规模比较小的公司#xff0c;树… 文 | 水哥源 | 知乎Saying1. 小的性能差异在容易实现面前一文不值这一点是XGBoost和LightGBM的最大优势2. 没能与embedding很好地结合无疑是树模型的灾难吃不下巨量的新数据也打不过DNN除了一些规模比较小的公司树模型在精排中已经灭绝了3. 但没能与embedding很好地结合却带给树模型无限生机在每一个需要模型但又不能上太重模型的场合树模型都可以灵活的存在。以这种方式树模型在推荐系统中获得了永生4. 想要成为精排模型的必要不充分条件是新出现的特征/取值不会对训练部署流程有任何中断或者形式上的改变这是【从零单排推荐系统】系列的第15讲。树模型在推荐中应用算法上的发展比较简单从决策树到基于树的Gradient Boosting Machine包括上一讲的GBDT都是抓小点和缝合为主。虽然XGBoost和LightGBM在GBDT的基础上各自还做了一些改进但都是属于修补性质的。这两个工作更加为人熟知的是工具上的发展越来越好开源的实现是很多人打比赛刷榜的利器。在实践中好用的框架/工具就是算法长盛不衰的秘诀。本讲的重点是一个很有意思的别的地方没有讨论过的问题在kaggle等比赛中树模型非常强势但是在实际业务中树模型几乎不会成为精排的选择为什么会出现这样一头热一头冷的情况其本质原因是要成为不断接受新数据新特征的门神模型必须拥有形式上的不变性。XGBoost[1]更加精致的GBM我们先延续上一讲的GBDT的推导来介绍XGBoost正如上一讲所说GBM的核心是级联很多模型后面的模型学习的都是前面模型综合后剩下的残差这里的公式含义都和上一讲完全保持一致。在这里我们可以做一个二阶的近似也就是按照泰勒展开到二阶项为止其中 分别表示在上一步对于 的一阶二阶偏导。由于的结果基本之前都已经算过了设现在这步需要拟合的目标是 的话就有为了能让这个式子继续简化可以假设模型结构 是一个回归树即样本对所有树都做一次预测而每棵树的叶子节点都有权重最后样本的概率是这些落入节点的权重的和可以换个方式来理解经过一些非线性操作也就是决策树决策的过程最后得到的仍然是一个binary的向量。1的点就是落入的叶子节点其他则是0然后相当于用一个LR来做分类。那么这个模型可以表示为若 还是一个二范数的正则化那么把这个代入到上面的式子中得到的就是一个二次项其中的按照维度拆解找对称轴和 《水哥推荐系统精排之锋2工业LR的稀疏要求挑战全网最好懂推导(https://zhuanlan.zhihu.com/p/408205665)》都是一样的就可以直接求解了。算法上XGBoost对寻找切割点的贪心做了效率上的优化不是遍历每一个点而是先通过特征分布寻找可能成为切割点的候选在遍历这些候选的点。在工程上XGBoost事先把排序结果存在Compressed Sparse Columns Format中并且用块压缩和块分区来优化IO速度。但工程优化不是这个专栏的重点主要是我也不会就不展开讲了。总结来说相对于GBDTXGBoost的主要优点有1.使用了二阶项作为更细的近似精度更高2. 使用正则项并且把叶子结点个数加入到正则项中可以控制模型的复杂度3. 在特征排序上和寻找切割点的过程中都做了并行化处理。LightGBM[1]极大加速的GBDTLightGBM是GBDT的另一种改进版本它的出发点是从样本角度和特征角度来简化GBDT的运算过程样本角度GBDT对于每一个样本都要参与运算而在LightGBM中给出了一个假设只有梯度大的哪些样本才会影响学习的过程梯度小的样本是一定程度上可以忽略的。基于这个假设我们要做的就是把梯度大的放回去继续优化梯度小的丢弃。但是还不是这么简单的如果梯度小的全丢了那么可能会引入bias所以我们可以选择梯度大的也就是排序前top a%全要后面的部分中采样出b%。采样后的部分要乘以一个系数 为啥是这个系数呢假如采样后和采样前均值 没发生变化乘完系数之后两类样本的比值没变这样可以尽量不让分布发生变化有没有注意到和之前说过的样本负采样很像还记得是哪一讲的吗。特征角度特征中有很多特征是不会同时为1的比如有一些one-hot特征性别年龄这样的一个用户只会有其中一个值不为0.那么遍历这样的所有取值是不太合理的。LightGBM提出把这些不会同时取1的特征合并在一起行成一个“束”这样寻找切割点的时候遍历起来会更快这个就叫做互斥特征捆绑Exclusive Feature Bundling。不过在实现上还有两个小问题第一个问题是选择谁和谁拼成一个新的特征第二个问题是具体怎么操作对于第一个问题lightGBM给出的做法是以特征为顶点以冲突同时为1有多大为边建图。每个节点的度是与其他节点冲突的大小由大到小挨个开始如果加入一个“束”会导致总的冲突数超过既定阈值 就新开一个“束”反之则加入。对于第二个问题其实就是把值域合并一下文章中举得例子是 的值域是 的值域是 那么给 加一个10的偏置再合起来新的特征值域就是。上面虽然介绍了现在树模型比较好用的两种算法/工具但是本讲的重点其实不是他们的原理而是在实践中我们如何选择是否使用树模型如果用的话用在哪些场合是比较理想的因为没有embedding树模型绝迹于精排我们这两讲提到了很多树模型的优点比如它的非线性是非常非线性的。但是大家如果对业界有所了解就会发现很少在实际业务的精排中看到树模型的身影这是为什么先抛出结论因为树模型不能很好的处理在线学习过程中源源不断的出现的ID类型的特征。虽然XGBoost和LightGBM都谈了对于未训练的值如何处理但在实际场景中这个数字可能会非常夸张。从冷启动这个角度来想如果我们希望我们的平台是富有活力的平台就理应会源源不断的出现新的item那么冷启动的规模就更大。现在的大平台上新item的比例应该远远超过50%在这么大的未出现样本面前树模型就显得捉襟见肘了。不能很好的解决这个问题树模型就不能负担得起精排的重任。当然树模型不是完全没有想过应对方案。前一讲的Facebook那篇文章其实就说了他们的树模型是一天一更新的如果不更新就会失去树模型强化分桶的作用。这个方案当然体现了他们对问题的深入思考但你也能看得出来这中间的勉强。如果树模型后面接的环节是一天重新训练不能收敛的这个方案还能用吗那么现在的精排模型怎么解决这个问题答案就是embedding每当新出现了ID我可以开辟一段新的空间来存储让这段embedding保留该特征的信息。一个新的embedding的加入虽然会引发冷启动问题但是对于训练部署的流程没有任何改动。因此基于embedding的embeddingDNN无往不利。有的同学可能会说那LR也没有embedding呀为什么它可以我们可以认为LR是有embedding的但是只有1维就是之前所说的特征的权重 。在未来还可能有新的形式或者模型出现但是我认为不管哪种模型来做精排新的特征出现时都不能在训练部署上出现中断或者形式的改变。目前为止还没有看到树模型和embedding很好地结合的例子或者准确地说是树模型没什么加embedding的必要和意义。embedding本质上是把低维的ID映射到一个更高的空间中记录更细致的信息我个人也有一些相关的经验比如把所有特征的embedding长度都翻倍基本上涨幅有大有小但是从来不会掉点。这表明更大的embedding拥有更多的存储空间而决策树是按照特征本身的信息划分的。因为没有embedding树模型得以长生上面明明说没有embedding树模型都快灭绝了这里怎么又说长生了乍一看这和上面的说法不是反着的吗可能这就是所谓的塞翁失马焉知非福了。embedding是很强很暴力但是embedding需要大量的空间Parameter Server来存。想想看如果一个特征的embedding维度是64原来LR中一台机器能存下的特征现在就需要64台机器来存这是非常可怕的空间消耗。而且推荐系统也不是除了召回粗排精排就没东西了还有许许多多小的环节需要模型来预估难道各个都用embeddingDNN的模型结构吗除了占用空间太大可能其中有的模型ROI也不太高不如就找个简单点的模型抗住呗这个时候树模型就可以大展身手了。既然它不需要embedding那它就很省空间。一些边边角角的地方需要模型时都可以考虑用它。不要小看这些边边角角的场合有些是发挥很大作用的举两个例子判断一个item处于生命周期中的哪个阶段在后面会讲讲这个概念现在可以简单理解为一个item有刚开始起量稳定膨胀流量下滑和死亡这么几个阶段根据这个阶段可以做不同的针对性决策此时Item ID做特征显然是没有意义的而是item现在总的曝光量已经投放了多久每个阶段的曝光转化等等。预测一个用户第二天是不是还会来有各种行为特征比如在某个类别下观看了多少视频用户已经用了多长时间今天的总播放时长是多少等等。这两个例子都是实践中使用树模型的典型场景也是非常重要的应用场景。第一个场景关系到在线广告系统中怎样为广告主分配流量。而第二个例子与留存-DAU这个漏斗的优化有关联。从这两个例子中归纳一下当触发以下两个条件时树模型自动进化为不二选择特征中没有不断新增的ID类特征categorical特征可以穷举比如年龄城市等。当输入的特征混有各种各样的categoricalnumeric等等类型的特征时尤其对于像counter计数类特征比如用户在APP上的时间类很有效果。经过上面的分析我们就能理解为什么在工业界树模型从精排模型中绝迹了但在kaggle等比赛中经常出现树模型的身影。因为kaggle的比赛大部分是闭集而且对特征设计要求较高这种情况很适合树模型发挥强大的非线性分类能力。开集与闭集以人脸识别为例闭集的含义是测试集的人你都见过只是现在给你的图片你没见过。而开集则指的是测试集中会出现新的人要判断这些没见过的人的图片之间是否相似。所以在公开数据集里面基本都是固定的人闭集而如果是产品则要面对开集场景。下期预告推荐系统精排之锋10DNN与两大门派往期回顾1.召回 粗排 精排如何各司其职2.拍不完的脑袋推荐系统打压保送重排策略3.简单复读机LR如何成为推荐系统精排之锋4.召回粗排精排-级联漏斗上5.召回粗排精排-级联漏斗下6.推荐系统精排看阿里妈妈再试线性模型7.推荐精排之锋FM的一小步泛化的一大步8.推荐中使用FNN/PNN/ONN/NFM优化特征交叉9.聊聊推荐系统的高阶特征交叉问题10.真正的高阶特征交叉xDeepFM与DCN-V211.GBDT是如何成为推荐系统顶级工具人的后台回复关键词【入群】加入卖萌屋NLP/IR/Rec与求职讨论群后台回复关键词【顶会】获取ACL、CIKM等各大顶会论文集 [1] XGBoost: A Scalable Tree Boosting SystemKDD2016 (https://www.kdd.org/kdd2016/papers/files/rfp0697-chenAemb.pdf)[2] LightGBM: A Highly Efficient Gradient Boosting Decision TreeNIPS2017 (https://proceedings.neurips.cc/paper/2017/file/6449f44a102fde848669bdd9eb6b76fa-Paper.pdf)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/83645.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

织梦做中英文网站织梦通用seo网站模板

解锁Python装饰器的魔力:提升代码魅力的秘密武器 Python的装饰器(Decorators)是一种特殊的语法构造,它允许我们在不修改被装饰函数源代码的情况下,通过在其周围添加额外功能或行为。 装饰器本质上是一个函数&#xf…

茂名企业自助建站如何查网站关键词

静态类 继承(多态)、静态本身就是相反的。另外需要知道属性、事件其实是些特殊的方法。 使用 static 修饰符声明属于类型本身而不是属于特定对象的静态成员。 static 修饰符可用于类、字段、方法、属性、运算符、事件和构造函数,但不能用于索…

做单页网站需要做什么的公众号内容制作步骤

文章目录 Pickle模块简介Pickle模块的使用 最近从Github上下载了一个预训练好的Faster-RCNN模型用于科研任务,突然对该文件的格式,.pkl文件产生了一丝疑惑,便去特意了解了一下该格式的文件的含义,下面与大家共享。 Pickle模块简介…

wordpress开启子站上海哪家网站建设好

技术方案建议 使用RESTful API:采用RESTful API架构,实现与OpenAI服务的交互和数据传输。数据安全:确保用户数据的安全性和隐私保护,采用加密传输和安全认证机制。用户界面设计:设计直观友好的用户界面,提…

网站模版网 下载传统媒体网站建设

一、概述 1.1介绍 Hutool是一个小而全的Java工具类库,通过静态方法封装,降低相关API的学习成本,提高工作效率,使Java拥有函数式语言般的优雅,让Java语言也可以“甜甜的”。 Hutool中的工具方法来自于每个用户的精雕细…

青岛网站设计建立公司中国建行官方网站

1 为什么向AMSAT社区提及VPX / VNX 1.1VPX是包括卫星在内的最新一代军用车辆增长最快的标准 VITA 65 – 面向地面车辆的 OpenVPX文献检索将揭示在许多商业和军事坚固型系统应用中的广泛应用VITA 78 – AFRL和工业界正在开发用于卫星的“SpaceVPX”和“Space VPX Lite” 1.2 …

做网站需要的知识做网站公司哪个比较好

前段时间做一个小项目,为了同时存储多条数据,其中有一个功能是解析Excel并把其中的数据存入对应数据库中。花了两天时间,不过一天多是因为用了"upload"关键字作为URL从而导致总报同一个错,最后在同学的帮助下顺利解决&a…

长沙网站建设价中学生做的网站有哪些方面

awk的脚本套路是: awk的脚步部分最好用一对单引号将 ‘BEGIN{} /pattern1/{}…/patternN/{} END{}’ 套起来, 因为常用到$号, $号在单引号中不会被转义, 在双引号中有取值的含义 awk -F 自定义分隔符 BEGIN{开始块} /pattern1/{操作pattern1过滤的行的块} /pattern2/{操作patt…

番禺建设工程交易中心网站免费网站制作多少钱

目录 1 redo log(重做日志)2 undo log(回滚日志)3 Binlog(二进制日志)4 两阶段提交4.1 执行过程4.2 系统崩溃后重启如何刷新数据4.3 redo log 和 bin log区别 MySQL是一个关系型数据库管理系统,…

玩具网站规划说明书购物网站微信小程序注册方式

5 月 8 日,上海交通大学电子信息与电气工程学院(简称电院)与阿里巴巴集团宣布共同成立人工智能与系统联合实验室(后称“联合实验室”),并在上海交大闵行校区举行了揭牌仪式。 上海交大电院副院长王贺升教授…

个人公司网站建设千年之恋网页制作代码

3 存储 3.1 存储引擎 3、InnoDB 的四大特性? InnoDB 是 MySQL 数据库中最常用的存储引擎之一,它的四大特性通常指的是: ACID 兼容性: 原子性 (Atomicity): 保证事务内的操作要么全部成功,要么全部失败,不会出现中间状态。例如,银行转账操作,从一个账户向另一个账户转…

网站 什么语言开发网站 怎么做百度才能搜索出来

ipython开发环境搭建以及pandas快速入门0.开发环境搭建技巧网页版ipython:ipython notebooknumpy1.pandas 快速入门一导入创建对象2. pandas 快速入门二空数据处理apply的用法count和mode函数数据合并3. pandas 快速入门三数据整形数据透视时间序列数据可视化数据载…

用户体验较好的网站移动互联网开发课程设计选题

😆😆😆感谢大家的观看😆😆 🌹 reshape 函数 transpose 和 permute 函数 view 和 contigous 函数 squeeze 和 unsqueeze 函数 在搭建网络模型时,掌握对张量形状的操作是非常重要的&#xff…

wordpress博客网站描述在哪里贵州企业网站建设公司

从源码解析Kruise原地升级原理 本文从源码的角度分析 Kruise 原地升级相关功能的实现。 本篇Kruise版本为v1.5.2。 Kruise项目地址: https://github.com/openkruise/kruise 更多云原生、K8S相关文章请点击【专栏】查看! 原地升级的概念 当我们使用deployment等Wor…

做企业网站选百度云还是阿里云网站一定也做数据库吗

idea打开工程的时候包名叠在一起了 点击箭头处按钮,把第一第二行勾去掉 如下 最终效果

建立内部网站需要多少钱专业app开发

目录 专栏导读之前的课程1、小球类设计2、挡板类的设计3、砖块类4、砖块与小球的边界碰撞检测5、检测到碰撞,删除砖块,改变运动方向完整版代码总结 专栏导读 🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手 …

最牛的网站建设c#网站开发模板

文章目录 数据库的隔离级别和锁机制一、数据库隔离级别1. 隔离级别说明2. 如何选择隔离级别3. 查询当前客户端隔离级别的命令.4. 修改隔离的命令 二、数据库中的锁1. 共享锁、排他锁2. 死锁3. 行级锁、表级锁 三、解决更新丢失问题1. 解决方案2. 乐观锁、悲观锁3. 乐观锁、悲观…

注册域名去哪个网站好关于政协 网站建设

PID算法的通俗讲解 PID算法的江湖地位? PID算法在控制领域是非常常见的算法,小到控制温度,大到控制飞机的飞行姿态,基本上算是在控制领域万能的算法。 关于PID算法的生活小故事: 假设一辆慢点量的车,跑着跑…

济南外贸网站建站江苏永坤建设有限公司网站

目录 一、C内存分布 二、C语言与C内存管理方式 1、C语言中动态内存管理方式:malloc/calloc/realloc/free 2、C中的内存管理方式:new/delete 三、operator new与operator delete函数 1、函数概念: 2、函数使用: 3、底层原理…

陕西正天建设有限公司网站做微商海报的网站

在宝塔面板环境下安装nps服务端 一、所需环境二、开始安装三、打开nps控制台四、更改默认账号密码和连接秘钥五、反向代理挂载SSL证书 一、所需环境 阿里云轻应用服务器(选择宝塔应用镜像)域名(最好也是阿里注册的域名)对应的ssl…