一文说明推荐优秀的系统特征交叉方法

news/2026/1/26 17:12:47/文章来源:https://www.cnblogs.com/tlnshuju/p/19534593

一文说明推荐优秀的系统特征交叉方法

2026-01-26 17:09  tlnshuju  阅读(0)  评论(0)    收藏  举报

推荐系统排序模型从开始的LR到现在的LLM,其中一个主要的效果提升脉络就是特征交叉,之前做了很多单篇论文的笔记,这里作下Summary:

一 非参数的特征交叉

通过不需要引进额外的权重矩阵,不需要专门训练,能够通过代码直接控制的特征交叉方法,由于推荐特征第一层一般都会经过一个embedding层,每个特征一般都会被编码成一个vector,故而这里的非参数关键聚焦在vector的交叉途径上。就是非参数的意思

  1. cartesian product(笛卡尔积)
    cartesain product 该是非vector上的交叉方法,在深度排序模型中使用很少,仅在 GBDT(XGBoost、LightGBM)或 LR + Crossing 中使用。
    在 DeepFM/FM 模型出现后,Cartesian 特征交叉已经少用,基于 FM 自动捕获二阶交互。
    在这里插入图片描述
  2. 内积/外积
    内积又叫Dot Product,深度学习时代极其常用,占 60%~70% 模型都在用 dot 交叉
    在这里插入图片描述
    外积是outer product,得到的是一个矩阵,能捕捉高阶相关性(比 dot product 更细粒度),但高维矩阵风险大,不一定能收敛,于是从业界采用情况来看属于比较小众流派
    在这里插入图片描述
  3. hardamard积:element-wise-product, 得到的还是一个vector,要求两个向量维度必须相同。
    a = [ a 1 , a 2 , . . . . , a m ] T a = [a_1, a_2, ...., a_m]^Ta=[a1,a2,....,am]T
    b = [ b 1 , b 2 , . . . . , b m ] T b = [b_1, b_2, ...., b_m]^Tb=[b1,b2,....,bm]T
    交叉后的结果为:
    c = [ a 1 ∗ b 1 , a 2 ∗ b 2 . . . , a m ∗ b m ] T c = [a_1* b_1, a_2 * b_2 ..., a_m * b_m]^Tc=[a1b1,a2b2...,ambm]T
    比 outer product 轻量, 比 dot product 细粒度, 允许学到“局部维度的特征交互”, 在深度学习流行程度中等
    对于非类别特征,或者数值特征,不经过处理的话,严格意义上就不是特征交叉了,是特征之间的数学运算( - / ) 等,这里暂时不考虑;在推荐系统里,数值特征大部分时候其实是做分箱处理,能更好的cover异常值等困难。

二 参数式的特征交叉

特征两两交叉(Pairwise Feature Interaction)

这类模型只对两个 field(如用户特征和商品特征)之间进行显式或隐式交互,是最经典、最基础的交互方式。

1. FM(Factorization Machines)——显式二阶交叉的开端

FM 是“自动特征交叉”的开山模型,本质是二阶 Polynomial 的低秩近似。

核心公式:
∑ i < j ⟨ v i , v j ⟩ \sum_{i<j} \langle v_i, v_j \ranglei<jvi,vj
FM 依据 embedding 向量的内积实现“二阶交互”,避免了传统 Polynomial 的维度爆炸。

2. DNN(MLP 隐式特征交叉)——YouTube 推荐率先使用

YouTube DNN 首次将 embedding concat → MLP 作为“深度交叉”。
DNN 的权重矩阵本质上在学习特征之间的复杂加权组合。

核心交互本质:
c r o s s e d _ v e c = w 1 ⋅ a + w 2 ⋅ b crossed\_vec = w_1 \cdot a + w_2 \cdot bcrossed_vec=w1a+w2b
MLP 会自动学习到多阶交叉,因此 DNN 是当前使用最广的参数式交互方式。

3. DCN(Deep & Cross Network)——显式多阶 Polynomial Cross

详细内容见:
DCN学习笔记

DCN 在 MLP 之外提供了一个“显式交叉分支”,通过多层 Cross Layer 构建高阶特征交叉。

交叉公式:
x l + 1 = x 0 ⋅ ( w T x l + b ) + x l x_{l+1} = x_0 \cdot (w^T x_l + b) + x_lxl+1=x0(wTxl+b)+xl
特点:


4. Bilinear Cross —— FiBiNet 的核心模块(微博提出)

详细内容见:
FiBiNet 学习笔记
FM、Hadamard 等交叉方法要求两个 embedding 维度一致。
通过Bilinear Cross 引入参数矩阵 W,使得两个 field 能够映射到同一空间进行交互。

交互公式(核心):
i n t e r a c t i o n i j = x i T W x j interaction_{ij} = x_i^T W x_jinteractionij=xiTWxj
特点:

5. CAN(Co-Action Network,阿里)——动态参数交叉

详细内容见:
CAN 学习笔记
CAN 的设计非常特别,它的 MLP 权重不是通过 BP 学习得到,而是直接由输入特征 reshape 出来的,比较trick,论文里显示阿里场景是落地的,在序列基础上还有提升。
核心思想:输入特征 P_induction → reshape → 作为另一个特征的 MLP 参数

6. PNN(Product-based Neural Network,Google)——乘积交互

PNN 是比 DeepFM、DCN 更早的参数式交叉模型,分两类:
PNN 是 最早将“乘积交互 + MLP”结合现在应该基本已经很少用了。就是的深度 CTR 结构,后续的 DeepFM、xDeepFM 等都受到其影响,但
(1) IPNN(Inner Product PNN)

显式进行 embedding 之间的内积。

(2) OPNN(Outer Product PNN)
对 embedding 做 outer-product(可参数化的)

7. CIN(Compressed Interaction Network)——xDeepFM 代表模型

详细见XdeepFM学习笔记
xDeepFM 中提出的特征交叉方式,CIN 是最典型的显式高阶交叉模型,可看作 DCN 的替代/升级,-显式高阶交互(比 DCN 更强), 复杂度比直接 outer product 小得多,在广告领域有真实落地

核心思想:
利用卷积式权重,显式构造特征间多阶 outer product 再压缩。
X k + 1 = f ( X 0 , X k , W ) X^{k+1} = f(X^0, X^k, W)Xk+1=f(X0,Xk,W)

二、样本维度的特征交叉(Sample-level Interaction)

这类模型跳出“两个特征对两个特征交叉”,
基于整个样本的所有 embedding 构造一个全局交互向量。就是而

1. MaskNet(微博)——基于 Mask 的 Sample-level Cross

详细内容见:
MaskNet 学习笔记
MaskNet 使用一条样本的所有 embedding concat 构造一个“instance-guide-mask”,然后利用 mask 对每个 embedding 做加权交互。
核心过程:

  1. embedding 全拼接:
    e = c o n c a t ( e 1 , e 2 , . . . , e n ) e = concat(e_1, e_2, ..., e_n)e=concat(e1,e2,...,en)

  2. 依据 2 层 MLP 得到 mask:

  3. mask 与每个 embedding 逐元素乘:
    e i ′ = m a s k ⊙ e i e_i' = mask \odot e_iei=maskei

  4. 多层 mask 堆叠可形成高阶交互

总结

方法交互方式是否显式是否真实落地
FM二阶内积显式二阶⭐⭐⭐⭐⭐
DNN隐式加权组合隐式高阶⭐⭐⭐⭐⭐
DCN显式多阶 polynomial显式高阶⭐⭐⭐⭐
Bilinear Cross双线性交互 + W 矩阵显式⭐⭐⭐
CAN动态参数交互显式+动态⭐⭐
PNN内积/外积 + MLP显式⭐⭐⭐
CIN显式高阶 outer product 压缩显式⭐⭐⭐⭐
MaskNetMask × embedding 的 sample-level特征交叉显式⭐⭐

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1219990.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年一体化污水处理设备公司权威推荐:絮凝沉淀池/mbr膜生物反应器/二氧化氯发生器/厌氧反应器/地埋式污水处理设备/选择指南

2026一体化污水处理设备实力厂商推荐据《2026-2030年中国污水处理设备行业发展白皮书》数据显示,2026年国内一体化污水处理设备市场规模同比增长18.7%,随着环保排放标准趋严,食品加工、畜禽养殖、市政生活等多领域对…

工程师之夜系列分享第三十九篇:Kafka、RocketMQ、JMQ 存储架构深度对比

引言 消息队列的存储架构是决定其可靠性、吞吐量、延迟性能的核心因素,直接影响业务场景适配能力。本文聚焦三款主流消息队列 ——Kafka(LinkedIn 开源,侧重高吞吐)、RocketMQ(阿里开源,金融级特性突出)、JMQ(…

红外碳硫分析仪怎么选不踩雷?对比生产厂家实力,共同锁定性价比好物

一、行业发展趋势:技术迭代与国产替代驱动市场爆发1.据第三方检测机构《2025年度国产高频红外碳硫分析仪品质评估报告》显示,2025年中国红外碳硫仪市场规模达3.8亿美元,年复合增长率超15%。这一增长由三大核心驱动力…

2025年度碳化硅定制服务排行榜,这五家口碑爆棚!精密铸造砂/白刚玉/棕刚玉/不锈钢灰/黑碳化硅/金刚砂/碳化硅/磨料碳化硅品牌找哪家

随着光伏新能源、第三代半导体、高端精密制造等战略性新兴产业的蓬勃发展,碳化硅作为关键的基础性材料,其市场需求正经历着从“标准化”向“定制化”的深刻转变。下游应用场景的多元化与精细化,对碳化硅的粒度分布、…

性能暴涨 1200 倍!我用 TypeScript 重构了这个经典项目

为什么需要重构&#xff1f; 起因&#xff1a;React Native 的"坑" 在将原版 relationship.js 集成到 React Native 移动端应用时&#xff0c;遇到了一个棘手的报错&#xff1a; ERROR [RangeError: Property storage exceeds 196607 properties] 这是因为原版 …

绝对干货! 网络安全面试题29问,(非常详细)零基础入门到精通,收藏这一篇就够了

1、php爆绝对路径方法&#xff1f; 单引号引起数据库报错 访问错误参数或错误路径 探针类文件如phpinfo 扫描开发未删除的测试文件 google hacking phpmyadmin报路径&#xff1a; /phpmyadmin/libraries/lect_lang.lib.php 利用漏洞读取配置文件找路径 恶意使用网站功…

Flink 2.0 从 flink-conf.yaml 到 config.yaml 的正确打开方式(含迁移与最佳实践)

1. Flink 配置加载机制&#xff1a;你改了文件但没生效&#xff1f;很可能就卡在这里 Flink 会在 Flink 进程启动时解析配置&#xff08;JobManager / TaskManager / HistoryServer 等进程启动时加载&#xff09;。所以&#xff1a; 改 config.yaml 之后必须重启相关进程才会生…

[特殊字符] 在浏览器地址栏输入 URL 后,页面是怎么一步步显示出来的?

这是一个前端面试 100% 会被问到的问题&#xff0c;但也是一个90% 的人答不完整的问题。你可能会说&#xff1a; “DNS 解析 ”“请求 HTML”“解析 DOM”“渲染页面” &#x1f449; 但如果继续追问&#xff1a; CSS 为什么会阻塞渲染&#xff1f;JS 为什么会卡住页面&…

动力电池点焊工艺解析

动力电池点焊机是电芯连接成组过程中的关键设备&#xff0c;其性能直接关系到电池包的结构完整性、电气安全性与长期可靠性。不同于普通的焊接设备&#xff0c;它针对动力电池的特定材料与工艺要求&#xff0c;在精度、一致性与可控性方面提出了严格标准。点焊工艺的核心&#…

【网络安全】红蓝对抗|备战大型攻防演练,这一篇就够了_红蓝对抗演练方案

大型攻防演练&#xff0c;红军镇守城池&#xff0c;与蓝军刺客般的灵活操作一较高下&#xff0c;双方在实战中倾尽 “巧思”&#xff0c;使攻击或防守达到事半功倍的效果。 “巧思” 为何&#xff0c;快上车&#xff0c;随我去战场一探究竟。 优秀的蓝军虽然要求团队每个人都…

2026年重庆职业高中综合实力排行榜 择校指南与各类需求全景解析

当前职业教育进入提质培优新阶段,重庆作为西部产业重镇,对技能人才的需求正朝着智能化、专业化、国际化方向升级。选择学校时不仅关注办学资质与规模,更看重实训配套、产教融合深度及定制化育人能力;家长与学生则聚…

永辉超市卡合规回收的平台怎么选,四大误区揭秘

整理旧物时,不少人会从抽屉深处翻出闲置的永辉超市卡。这些永辉超市卡因用不上而被遗忘,甚至临近有效期仍未启用。闲置的永辉超市卡并非只能沦为“沉睡物品”,通过合规的回收渠道就能合理盘活,但市场上的回收渠道良…

2026一体化污水处理设备优质公司推荐

2026一体化污水处理设备优质公司推荐行业背景与推荐依据据《2026-2030中国污水处理设备行业发展白皮书》数据显示,国内工业废水与生活污水年排放量超700亿吨,随着环保排放标准持续升级,全国范围内老旧污水处理设施改…

2026英语雅思零基础培训辅导机构推荐榜单 核心解析 助力家长精准匹配适配零基础辅导机构

对于计划让孩子备考雅思、规划留学,但孩子属于雅思零基础的家长而言,选择一家合适的英语雅思零基础培训辅导机构,是助力孩子迈出备考第一步、稳步夯实基础的核心困惑。很多家长翻遍各类机构介绍,却分不清哪家的零基…

孤能子视角:文心AI点评朝代分析系列

好的&#xff0c;我们来点评一下“孤能子”在CSDN上对中国主要朝代的分析。这位作者“孤能子”的视角非常独特且系统&#xff0c;他并非采用传统的历史学、社会学或政治学单一学科视角&#xff0c;而是构建了一个名为“EIS”&#xff08;能量-信息-结构&#xff09;的动力学模型…

2025年不容错过的烧菜火锅店,附近这6家实力上榜!社区火锅/特色美食/烧菜火锅/火锅/美食,烧菜火锅品牌排行

烧菜火锅市场:从“地方特色”到“消费刚需”的进化 近年来,烧菜火锅凭借“现烧现烫”的差异化模式,在火锅红海中开辟出细分赛道。其核心逻辑在于将川菜烧菜工艺与火锅场景深度融合,通过“一菜两吃”提升食材附加值…

孤能子视角:“心理学“

我将以EIS理论的“孤能子”视角&#xff0c;将心理学视为一个在人类认知场中演化的超级“学科孤能子”&#xff0c;并按照您之前设定的 “作者-作品-现实警示” 三步结构进行分析。请注意&#xff0c;此处的“作者”与“作品”需做适应学科特性的转义。 第一步&#xff1a;分析…

黑客技术之黑客常见10大攻击技术,你知道几个?_黑客一般采用哪些网络攻击技术

1、键盘监听 键盘监听就是利用一种监视间谍软件&#xff0c;将消息、电子邮件、击键信息等记录到一个日志文件中&#xff0c;或贩卖给他人。这其中就包含你的密码、社保号、信用卡信息等。 2、Ddos攻击 即利用众多来源的流量&#xff0c;涌入对方在线服务系统使其瘫痪。 黑…

孤能子视角:“精神分析“

(姑且当科幻小说看)第一步&#xff1a;分析“作者”——西格蒙德弗洛伊德&#xff08;作为精神分析“母体孤能子”&#xff09;启动&#xff1a;三力逼问&#xff0c;定位张力1. 零预设&#xff1a;不预设弗洛伊德是“科学先驱”或“江湖术士”&#xff0c;视其为在19世纪末维也…

2026最全网络安全工程师面试题(附答案),金九银十找工作必看!

2024年金九银十马上来了&#xff0c;先来灵魂三连问&#xff0c;去年定的的目标完成多少了&#xff1f;薪资涨了吗&#xff1f;女朋友找到了吗&#xff1f; 话不多说&#xff0c;直接上面试题 一、网络安全岗面试题 1. 什么是 DDoS 攻击&#xff1f;如何防范&#xff1f; 答…