备案期间能否做网站解析wordpress php占内存

news/2025/9/23 21:25:04/文章来源:
备案期间能否做网站解析,wordpress php占内存,网站设计参考网站,网站开发页面怎么进尽管BERT为代表的预训练模型大肆流行#xff0c;但是身处工业界才会知道它落地有多难#xff0c;尤其是QPS动辄几百的在线推荐、搜索系统#xff0c;哪怕在大厂也很难在线上系统见到它们。 今天就想反其道而行之#xff0c;谈谈工业界搜索、推荐、广告这类核心场景中落地能…尽管BERT为代表的预训练模型大肆流行但是身处工业界才会知道它落地有多难尤其是QPS动辄几百的在线推荐、搜索系统哪怕在大厂也很难在线上系统见到它们。 今天就想反其道而行之谈谈工业界搜索、推荐、广告这类核心场景中落地能力最强的算法之一因子分解机FM。我不敢说它是最简单的FM的确很简单但是作为一个推荐算法调参工程师掌握FM一定是性价比最高的。我推崇FM算法的原因有以下三点 功能齐全 众所周知推荐算法有三个应用领域召回、粗排、精排。推荐算法千千万但是有的算法只能用于召回有的算法只能用于排序。像FM这样实现三个领域全覆盖的多面手目前为止孤陋寡闻的我尚不知道有第二个。但是需要强调的是我们不能只训练一个FM排序模型 然后直接拿这个排序模型用于召回。尽管都是基于FM算法但是FM召回与排序有以下不同 使用的特征不同 FM召回由于未来要依赖Faiss进行线上检索所以不能使用user与doc的交叉特征。只有如此我们才能独立计算user embedding与doc embedding FM排序则没有这方面的限制可以使用user与doc的交叉特征。是的你没看错。因为FM所实现自动二阶交叉仅能代表“共现”。但是user与doc之间还有其他形式的交叉比如user tag与doc tag之间的重合度喂入这样的交叉对于排序性能提升仍然有很大帮助。 使用的样本不同 训练FM做排序时必须使用“曝光未点击”这样的“真负”样本。 训练FM做召回时起码不能只使用“曝光未点击”做负样本。大部分的负样本必须通过随机采样得到。个中原因见我的文章《负样本为王评Facebook的向量化召回算法》。 使用的Loss不同 FM排序时由于负样本是真实的可以采用CTR预估那样的point-wise loss FM召回时由于负样本是随机采样得到的存在一定的噪声最好采用BPR, hinge这样的pair-wise loss。 性能优异 推荐系统的两大永恒主题“记忆”与“扩展”FM也能实现全覆盖。 FM存在一阶项实际就是LR能够“记忆”高频、常见模式 FM存在feature embedding。如我在《无中生有论推荐算法中的Embedding思想》据说Embedding是提升推荐算法“扩展性”的法宝。FM通过feature embedding能够自动挖掘低频、长尾模式。在这一点上基于embedding的二阶交叉并不比DNN的高阶交叉逊色多少。 便于上线 现在深度学习是推荐领域的宠儿LR/FM/GBDT这样的传统机器学习算法不招人待见。 DNN虽然性能优异但是它有一个致命缺点就是上线困难。训练的时候各位调参侠把各种酷炫的结构什么attention, transformer, capsule能加上的都给它加上看着离线指标一路上涨心里和脸上都乐开了花却全然无视旁边的后端工程师恨得咬紧了牙根。模型越复杂离线和线上指标未必就更好但是线上的时间开销肯定会增加轻则影响算法与后端的同事关系打工人何苦为难打工人重则你那离线指标完美的模型压根没有上线的机会。虽说目前已经有TF Serving这样的线上serving框架但是它也不是开箱即用的也需要一系列的性能调优才能满足线上的实时性要求。 所以如果你身处一个小团队后端工程人员的技术能力不强DNN的线上实时预测就会成为一个难题这个时候FM这样的传统机器学习算法就凸显出其优势。 FM排序虽然理论上需要所有特征进行二阶交叉但是通过公式化简可以在 O(n)的时间复杂度下完成。n是样本中非零的特征数目由于推荐系统中的特征非常稀疏所以预测速度是非常快的。 召回由于候选集巨大对于实时性的要求更高。很多基于DNN的召回算法由于无法满足线上实时生成user embedding的需求只能退而离线生成user embedding 对于用户实时兴趣的捕捉大打折扣。FM召回这时就显现其巨大的优势。事先把doc embedding计算好存入Faiss建立索引user embedding只需要把一系列的feature embedding相加就可以得到再去faiss中进行top-k近邻搜索。FM召回可以实现基于用户最新的实时兴趣从千万量级候选doc中完成实时召回。 总结与参考 由于以上优点我心目中将FM视为推荐、搜索领域的瑞士军刀。风头上虽然不及DNN那么抢眼但是论在推荐系统中发挥的作用丝毫不比DNN逊色有时还能更胜一筹。FM有如此众多的优点优秀的调参侠打工人还等什么还不赶快学起来。想迅速掌握FM我推荐如下参考文献 掌握FM原理推荐读美团的博客《深入FFM原理与实践》。FFM的部分可以忽略在我看来FFM更像是为了Kaggle专门训练的比赛型选手损失了FM的很多优点。这就好比奥运会上的射击冠军未必能够胜任当狙击手一样。 FM用于召回推荐读《推荐系统召回四模型之全能的FM模型》。注意如我所述FM虽然万能但是FM排序与FM召回在特征、样本、Loss都存在不同不可能训练一个FM排序就能直接拿来做召回。这一点《全能FM》一文没有提到需要读者特别注意。 如果想亲手实践可以尝试alphaFM。该项目只不过是作者八小时之外的课外作品却被很多公司拿来投入线上实际生产环境足见该项目性能之优异和作者功力之深厚令人佩服。强烈建议不满足只当“调参侠”的同学通读一遍alphaFM的源代码一定收获满满。 [1] https://zhuanlan.zhihu.com/p/165064102 [2] https://zhuanlan.zhihu.com/p/320196402 [3] https://link.zhihu.com/?targethttps%3A//tech.meituan.com/2016/03/03/deep-understanding-of-ffm-principles-and-practices.html [4] https://zhuanlan.zhihu.com/p/58160982 [5] https://link.zhihu.com/?targethttps%3A//github.com/CastellanZhang/alphaFM

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/913932.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

零基础建设网站视频wordpress当前页面id

1 引言 在学习前,我想说一句,那就是为什么要学习Java。 每个人的出发点都不同,对于做信息化的工程技术人员来说,java不懂,就没法干项目。 尽管有c和matlab等基础,但java看起来与这些语言都不太一样。 做…

深圳市盐田区住房和建设局网站泽成杭州seo网站推广排名

文章目录 1. 添加动画2. Animation2.1 制作界面2.2 制作好的 Animation 动画2.3 添加和使用事件 3. Animator3.1 制作界面3.2 一些参数解释3.3 动画参数 4. Animator中相关类、属性、API4.1 类4.2 属性4.3 API4.4 几个关键方法 5. 动画播放和暂停控制 1. 添加动画 选中待提添加…

为什么我的网站没有百度索引量国产做爰全免费的视频网站

STM32 在 Windows 上的交叉编译二 调试 在上一篇博客 《在Windows上交叉编译STM32(环境搭建)》 ,已经让 CubeMX 生成的工程成功编译,并下载到板子上了。 这篇博客主要继续介绍接下来的步骤,调试。硬件是使用的 ST-LINK ,别的也无…

旋转图像-leetcode

题目描述 给定一个 n n 的二维矩阵 matrix 表示一个图像。请你将图像顺时针旋转 90 度。 你必须在 原地 旋转图像,这意味着你需要直接修改输入的二维矩阵。请不要 使用另一个矩阵来旋转图像。 示例 1:输入:matrix …

【ChipIntelli 系列】ASR部分——合成语言模型和多网络(多语种)切换

打开 ChipIntelli 的AI开发平台,找到组件开发的语言模型开发。在页面中编辑语料然后下载文件 共有两个文件夹:拷贝两个文件夹下的文件到SDK中 以双网络为例: 如果您使用的是CI130X SDK,请按如下步骤将合成的文件拷…

dots.llm1:小红书开源的 MoE 架构大语言模型 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

哪些ERP系统值得长期使用?2025年最新盘点来了!

哪些ERP系统值得长期使用?2025年最新盘点来了!在数字化转型加速的背景下,企业对ERP系统的依赖日益加深。根据行业调研数据显示,持续应用集成化ERP系统的企业在运营效率、数据准确性和战略决策能力上较传统管理模式有…

商品网站建设设计思路dw怎么做网站

文章目录 一、redis1.1 redis概述1.2 redis安装 二、string2.1 基础命令2.2 存储结构2.3 应用 三、list3.1 基础命令3.2 应用 四、hash4.1 基础命令4.2 存储结构4.3 应用 五、set5.1 基础命令5.2 存储结构5.3 应用 六、zset6.1 基础命令6.2 存储结构6.3 应用 一、redis 1.1 re…

下载网站源码行业网站设计公司

文章来源:http://www.bjfhrd.com 体育木地板上有许多暗门,以制造特殊效果,如火焰、烟雾,使房屋、树木、山或人物在一瞬间出现或销售。这种特殊的要求,对于专业体育木地板德施工就有了一定的要求。 专业体育木地板施工&…

湖南教育平台网站建设查公司注册信息怎么查

转载自 关于SimpleDateFormat时间格式化线程安全问题昨天推送的文章《关于创建和销毁对象》一文中,2.1重复利用对象这一小节所举的SimpleDateFormat格式化时间的例子是不合适的,因为多线程场景下,SimpleDateFormat存在线程安全问题。在此&am…

网站的建设与维护需要资质吗网站设置子目录

HTTP HTTP版本HTTP2和HTTP3区别 HTTP版本 HTTP(超文本传输协议)的发展史可以分为以下几个版本: 1. HTTP/0.9:最初的版本只能传输HTML文本,并且没有header和body,仅支持GET请求。 2. HTTP/1.0&#xff1a…

如何对网站的图片做cdn如何做企业文化培训

1、什么是流 我们可以先想象水流是怎样的?溪水不断流动,最终融入大海;我们今天的学习IO其实如同水流一样,当我们读取文件信息或者写入信息时,如同水流一样,不断读取或者写入,直到业务流程结束。…

个人导航网站怎么备案网站上线准备

本文来自腾讯蓝鲸智云社区用户: CanWay 平台化工程涉及双重核心意义。一方面,是类似利用IDE等工具提高工程师效率的平台化工程,如GitOps或命令行调度般便捷。然而,本文重点探讨的是基于价值流的平台化工程,尤其针对传统金融行业&a…

部队网站模板html网页框架代码实例

分类算法之逻辑回归逻辑回归(Logistic Regression),简称LR。它的特点是能够是我们的特征输入集合转化为0和1这两类的概率。一般来说,回归不用在分类问题上,因为回归是连续型模型,而且受噪声影响比较大。如果…

好看的单页面网站中小企业网站功能

#需要资源或有问题的,可私博主!!! #需要资源或有问题的,可私博主!!! #需要资源或有问题的,可私博主!!! 某企业根据自身业务需求&…

内网环境怎么安装软件(用 yum / apt 下载离线包并搬入内网)

目录内网环境怎么安装软件(用 yum / apt 下载离线包并搬入内网) 内网环境怎么安装软件(用 yum / apt 下载离线包并搬入内网) 很多同学觉得在内网装软件很简单:在有网络的机器上把包下载好,再拷贝到内网安装。思路…

tanh函数

tanh函数(双曲正切函数)是神经网络中一种常用的激活函数,它的数学表达式为: $$\tanh(x) = \frac{e^x - e{-x}}{ex + e^{-x}}$$ 它的输出范围是 $(-1, 1)$。 tanh函数的特点非线性:和 Sigmoid 函数一样,tanh 函数…

P13617 [ICPC 2024 APC] Bit Counting Sequence

P13617 [ICPC 2024 APC] Bit Counting Sequence对于一个非负整数 \(x\),令 \(p(x)\) 为 \(x\) 的二进制表示中 1 的个数。例如,\(p(26)=3\),因为 \(26=(11010)_2\)。 给定长为 \(n\) 的整数序列 \((a_1, a_2, ..., …

成都捕鱼网站建设做设计需要知道的几个网站

【2023高教社杯】D题 圈养湖羊的空间利用率 问题分析、数学模型及MATLAB代码 1 题目 题目 D 题 圈养湖羊的空间利用率 规模化的圈养养殖场通常根据牲畜的性别和生长阶段分群饲养,适应不同种类、不同阶段的牲畜对空间的不同要求,以保障牲畜安全和健康&a…

网页模板素材网站最新网球赛事新闻

烛秋 http://www.cnblogs.com/cswuyg/archive/2011/09/30/dll.html 动态链接库的使用有两种方式,一种是显式调用。一种是隐式调用。 (1) 显式调用:使用LoadLibrary载入动态链接库、使用GetProcAddress获取某函数地址。 &am…