推荐算法之粗排 - 详解

news/2025/11/7 17:44:07/文章来源:https://www.cnblogs.com/yxysuanfa/p/19200479

一、概念

推荐环境中就是粗排(粗粒度排序)连接召回与精排的核心环节,其核心目标是在召回阶段返回的海量候选集中筛选出高潜力候选,同时满足严苛的计算效率要求。

二、定位

推荐系统的典型链路为召回 → 粗排 → 精排 → 重排。粗排介于召回与精排之间,其输入是召回阶段返回的候选集,输出是精排所需的候选集。至于粗排返回的候选集大小,则并没有严格的限制,需综合考虑召回数据量、应用场景等。

推荐系统的这种级联设计的本质是效率与效果的平衡:召回追求候选集的多样性和覆盖度,粗排依据初步筛选减少精排的计算压力,精排则聚焦精细化排序。粗排的作用主要可以归纳为下面几点:

  • 降低计算成本:精排模型(如深度神经网络)对单个候选的计算耗时通常为毫秒级,若直接处理召回的万级候选,总耗时将超过线上服务的时延限制(通常要求<50ms)。粗排凭借过滤低价值候选,将精排的计算量压缩至可接受范围。
  • 提升排序效果通过模型预估用户偏好,保留就是:粗排并非简单的 “数量裁剪”,而高潜力候选,为精排给出更优质的输入。例如,电商场景中粗排可优先保留高点击率、高转化率的商品,避免精排被低质候选干扰。
  • 缓解样本选择偏差:召回阶段的候选集可能存在严重的曝光偏差(仅包含历史曝光商品),粗排通过引入精排的后验信息(如点击率、转化率),可部分修正此种偏差,提升候选集的全域覆盖能力。

历史上,粗排的发展大致经历了四个阶段:

  • 规则驱动阶段(第一代):基于人工规则(如商品销量、类目热度)进行筛选,缺乏个性化且实时性差。
  • 线性模型阶段(第二代):采用逻辑回归(LR)、梯度提升树(GBDT)等模型,通过特征工程实现初步个性化,但表达能力有限。
  • 双塔模型阶段(第三代):基于深度神经网络的双塔结构(用户塔 + 物品塔),通过向量内积迅速计算相似度,成为工业界主流方案。
  • 全连接模型阶段(第四代):以COLD模型为代表,借助轻量级全连接网络支持特征交叉,结合工程优化(如特征筛选、量化)构建效果与效率的突破。

三、主流技术

要理解粗排模型的设计逻辑,核心需紧扣其“高吞吐量、低延迟、轻量级”的核心诉求 —— 既要快捷筛选掉绝大多数不相关候选,又要避免漏过潜在优质候选。

1.机器学习模型

机器学习类模型的核心优势是“极致轻量化”:参数少、推理仅需简单线性/低阶计算,延迟可低至微秒级,能轻松支撑每秒百万级候选的筛选。缺点是泛化能力有限,难以捕捉复杂特征交互,但对粗排的 “敏捷过滤” 需求适配度极高。

1.1 逻辑回归LR

学习“哪些特征对推荐有效”(通过权重w体现)。就是LR是最简单的线性分类模型,通过对特征向量做线性加权,再经sigmoid函数映射为[0,1]的推荐分数。其中,x是输入特征向量(如用户年龄、物品类别、历史点击次数等),w是特征权重,b是偏置项。模型本质

1.2 因子分解机FM

LR无法捕捉特征间的交互(如“用户年龄 = 25”与“物品类别=游戏”的组合效应),FM依据隐向量(Latent Vector)消除这一问题。泛化能力优于LR,计算复杂度可控(若在粗排阶段使用FM,一般会设计轻量化的FM模型结构),训练成本低。

2.深度学习模型

深度学习类模型的核心优势是“强泛化能力”:能自动捕捉高阶非线性交互、甚至协同过滤信号(如用户-物品交互关系),筛选精度高于机器学习模型。但需严格控制模型复杂度(如浅层网络、简化结构),避免突破粗排的延迟上限。

2.1 MLP

MLP(仅包含 1~2 个隐藏层)输入为拼接后的特征向量(如用户特征 + 物品特征 + 上下文特征),通过线性变换 + 激活函数(如 ReLU)捕捉高阶非线性交互,输出推荐分数。泛化能力强于机器学习模型推理延迟可控

2.2 Wide&Deep

Wide & Deep的核心是“记忆(Memorization)+ 泛化(Generalization)”双路径,粗排场景中需对其简化以降低延迟。Deep路径:用浅层MLP(1层隐藏层,64~128维),输入“泛化性特征”(如用户兴趣隐向量、物品embedding),负责捕捉 “用户潜在兴趣”(如用户喜欢篮球鞋,可能也喜欢运动袜)。兼顾“不漏选”和“精准筛”:Wide路径保证用户明确感兴趣的候选不被过滤(避免粗排“误杀”优质候选),Deep路径提升对长尾候选的泛化能力(避免只保留热门候选)。模型适配全量候选场景,无论是热门候选(依赖 Wide 路径)还是长尾候选(依赖 Deep 路径),均能奏效覆盖。

2.3 GCN

通过就是LightGCN是GCN(图卷积网络)的简化版,针对“用户 - 物品交互图”设计,核心1~2 层图卷积学习用户/物品的嵌入向量,无需非线性激活和特征变换。

  • 图结构:节点为“用户”和“物品”,边为“用户 - 物品交互”(如点击、购买);
  • 图卷积操作:每个节点的嵌入向量 = 自身嵌入 + 邻域节点嵌入的平均(如用户嵌入 = 初始用户嵌入 + 其点击物品嵌入的平均);
  • 推荐分数:用户嵌入与物品嵌入的余弦相似度,作为推荐分数。

2.4 双塔模型

双塔模型是推荐系统粗排阶段的经典架构,其核心设计理念是将用户特征与物品特征解耦编码,通过低维向量的相似度快速筛选候选集,特别适合处理亿级规模的实时推荐场景。关于模型的原理和实现,可以参考这里,此处不再赘述。

2.5 COLD模型

COLD(Computing Power Cost-Aware Online and Lightweight Deep Pre-Ranking System)是阿里巴巴提出的第四代粗排模型,核心解决算力成本与模型复杂度的平衡问题,允许在粗排阶段使用复杂深度模型(如多层全连接网络),同时经过算法与系统协同设计将延迟控制在 10~20ms 以内,突破了传统双塔模型的表达瓶颈,实现了繁琐深度模型在粗排阶段的落地。架构上,COLD模型的核心创新点重要有:

  • 引入 SE Block动态计算特征重要性权重,结合 Top-K 特征选择策略,过滤噪声特征并保留关键交叉特征(如 “用户年龄 × 商品价格”),同时协助7层全连接网络捕捉高阶非线性交互;
  • 通过多级并行计算(查询分割 + 多线程特征拉取)、列计算结合SIMD指令提升缓存利用率,以及FP16低精度GPU加速(速度较FP32提升8倍),将麻烦模型延迟控制在10~20ms。

四、评估指标

在推荐系统的粗排阶段,评估指标的核心设计目标是平衡“筛选准确性”与“推理效率”—— 既要确保粗排能从万级 / 十万级召回候选中高效筛选出尽可能多的优质样本(避免 “漏选” 优质候选,否则精排无法补救),又要保证模型推理速度足够快(支撑高吞吐场景),同时需间接对齐业务价值。

1 效果指标

粗排的核心任务是“初步排序 + 筛选”,需优先保证“优质候选不被淘汰”,因此排序效果指标更侧重“召回能力” 和 “粗排序顺序的合理性”(无需达到精排的极致精度,但需为精排供应高质量输入)。常用指标有精度、召回、F1、MAP和NDCG等。这里展开介绍下后面两个:

1.1 MAP

MAP 是“平均精度(AP)”的均值,其中AP衡量 “在不同召回截断位置(如前 100、前 200 个样本)的精确率的平均值”,本质是将“召回顺序”纳入评估否被粗排排在更靠前的位置(靠前的位置被选中的概率更高)。计算逻辑:就是—— 即优质样本

  • 对单个用户的候选列表,按粗排分数从高到低排序;
  • 遍历每个正样本的位置k,计算 “前k个样本的精确率”;
  • 对所有正样本的 “前k精确率” 取平均,得到该用户的 AP;
  • 对所有用户的 AP 取平均,得到 MAP。

MAP适合粗排 “排序能力” 的对比:尤其当粗排模型从“线性模型”升级为“轻量深度学习模型”时,MAP可有效衡量排序能力的提升。

1.2 NDCG

归一化折损累积增益(NDCG, Normalized Discounted Cumulative Gain),考虑样本“价值差异”。NDCG 衡量“排序结果对用户价值的贡献”,核心改进是NDCG中的正样本并非等价:不同正样本的价值不同(如 “下单” 样本价值>“点击” 样本,“完播 30 分钟” 样本价值>“完播 5 分钟” 样本);位置越靠后,价值折损越大(用户更可能关注靠前的推荐结果)。计算逻辑:

  • 折损累积增益DCG:对排序后的列表,按位置 i 计算每个样本的价值分,并按位置折损:,其中,k 为粗排筛选的截断位置。
  • 理想DCG:即IDCG,将样本按照从大到小排序后计算的DCG,即最优排序的最大可能DCG。
  • NDCG:DCG与IDCG的比值,归一化到0和1区间内,

NDCG适合 “样本价值有差异” 的业务场景:如电商推荐中,“高客单价下单” 样本比 “低客单价下单” 样本价值更高,NDCG 可优先保证高价值样本被粗排选中并排在靠前位置。

2 效率指标

粗排的核心定位是 “高效筛选”,若推理速度慢、资源占用高,则失去了存在的意义(直接用精排处理所有召回候选即可)。效率类指标直接决定粗排能否支撑 “万级 / 十万级候选” 的高吞吐场景。主要的指标有推理延迟Latency、每秒查询率(QPS, Queries Per Second)、模型参数量与计算量(FLOPs),这里就不展开叙述了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/959060.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年TWS耳机磁铁厂家权威推荐榜单:手机磁铁/钕铁硼磁铁/稀土磁铁源头厂家精选

在TWS(真无线立体声)耳机市场持续增长的背景下,微型高性能磁铁作为决定耳机音质、续航与结构紧凑性的核心元件,其技术门槛与性能要求正日益提升。据行业调研数据显示,2024年全球消费电子用塑料磁铁市场规模约达1.…

2025年11月制冷设备/螺杆机维修厂家口碑排行榜单:阜阳市展翼翔制冷技术有限公司

文章摘要 2025年维修厂家行业持续发展,制冷服务需求增长,高效节能成为核心趋势。本文基于权威数据和用户口碑,发布维修厂家推荐排行榜单,重点介绍阜阳市展翼翔制冷技术有限公司的专业优势,并提供表单供参考选择。…

2025 年aippt 软件最新推荐排行榜:专业评测揭晓靠谱工具,覆盖一键生成、免费素材与多场景适配markdown 生成 ppt/word 生成 ppt/在线生成 ppt/文档生成 ppt 工具推荐

引言 在数字化办公加速渗透的今天,PPT 作为信息传递与成果展示的核心载体,其制作效率与呈现质量直接影响职场竞争力。然而传统制作模式下,内容逻辑梳理、设计排版调整往往耗费数小时甚至数天,非设计专业用户更难兼…

深圳GEO优化源头公司:GEO到底值不值得做?

在深圳,每天都有数十家企业问:“GEO优化到底值不值?”作为深耕AI营销的源头公司,讯灵AI见过太多企业从“犹豫观望”到“主动追加预算”—— 答案从来不是“跟风做”,而是“看能不能解决真问题”。 先看三个真实场…

2025年整个年度成都抖音/快手/小红书/视频号短视频代运营推广公司/厂家Top10排名:杰诚智享领跑行业

文章摘要 2025年,成都抖音推广行业随着短视频营销的爆发式增长,已成为中小企业获客的核心渠道。本文基于市场调研和案例数据分析,列出2025年成都地区抖音推广服务商Top10排名,旨在为企业提供参考。排名综合考虑服务…

靠谱的GEO搜索优化系统推荐,讯灵AI-GEO+Agent打开AI时代新纪元

随着生成式人工智能深度融入用户信息获取路径,AI搜索正以前所未有的速度重塑数字营销格局。在此背景下,GEO(生成式引擎优化,Generative Engine Optimization) 已从“营销新概念”跃升为企业获取流量、塑造品牌、驱…

2025年11月维修制冷螺杆机维修厂家推荐:高效制冷解决方案

摘要 随着制冷行业在2025年的快速发展,维修厂家市场呈现出技术升级和服务多元化的趋势。本文基于行业数据和用户口碑,为您呈现一份权威的维修厂家推荐排行榜单,旨在帮助用户选择高效、可靠的制冷服务提供商。排名综…

口碑好的GEO优化+智能体营销双引擎系统厂家

口碑好的GEO优化+智能体营销双引擎系统厂家剖析 在 AI 驱动营销变革的当下,单纯的 GEO 优化已难以满足企业 “精准触达 + 高效转化” 的全域需求,而 GEO+Agent 双引擎系统正成为企业抢占 AI 搜索流量、实现营销闭环的…

2025年11月阜阳制冷设备维修/螺杆机服务厂家推荐排行榜单:阜阳市展翼翔制冷技术有限公司位列榜首

摘要 本文探讨2025年维修厂家行业的发展趋势,随着制冷技术智能化和节能化需求的提升,维修服务正朝着专业化、集成化方向演进。行业竞争加剧,用户对口碑好、有实力的维修厂家需求日益增长。本文提供一份基于权威数据…

2025年11月成都抖音推广机构权威推荐榜TOP10:探究抖音推广机构

2025年11月成都抖音推广机构权威推荐榜TOP10:探究抖音推广机构 摘要 2025年成都抖音推广行业持续蓬勃发展,随着数字营销需求的增长,本地企业纷纷寻求专业服务商提升线上影响力。本文基于市场调研和用户反馈,整理出…

2025 年 11 月深圳店铺装修公司推荐排行榜,餐饮店铺装修,商场店铺装修,连锁店铺装修,零售店铺装修设计公司推荐

2025 年 11 月深圳店铺装修公司推荐排行榜 行业背景分析 深圳作为中国最具活力的创新城市之一,商业空间装修行业伴随着城市商业的快速发展不断升级。随着消费模式的变革,店铺装修已从简单的空间装饰转变为品牌形象塑…

2025 年 11 月密封胶条,系统门窗胶条,森特达胶条厂家最新推荐,实力品牌深度解析采购无忧之选!

引言 在密封材料领域,密封胶条、系统门窗胶条、森特达胶条作为关键组件,其质量直接影响终端产品的密封性能与使用寿命。为帮助采购商精准选择优质品牌,行业协会联合专业测评机构开展了 2025 年度胶条厂家测评工作。…

2025 年离心机源头厂家最新推荐榜:聚焦卧式螺旋卸料沉降等多类型设备,实力企业权威测评推荐防爆螺旋/油泥螺旋/向心泵螺旋离心机公司推荐

引言 当前固液分离领域对离心机设备的效率、适配性及环保性要求持续攀升,市政污水、印染、制药等数十个行业的生产与污水处理环节,均需高效稳定的离心机设备支撑。为助力企业精准筛选优质合作伙伴,行业协会联合专业…

GEO优化哪个公司做得好?南方网通讯灵AI-GEO+Agent助力企业抢占AI搜索新赛道

一、GEO优化哪个公司做得好? 这可能是困扰无数企业决策者、运营者和市场人的问题。在线上流量成本高企的今天,谁能精准驾驭线下地理空间数据,谁就掌握了降本增效、开拓增长的密钥。 传统的“GEO优化”或许还停留在简…

护手仪ESD整改-ASIM阿赛姆

本次来我司整改产品护手仪,外壳为塑料,测试点为充电pogo+和充电pogo-。按IEC/EN61000-4-2标准测试静电后关机,以下为测试数据: 一、整改前数据:整改方案: 1.在网络P9,RST对地并联ESD(型号:阿赛姆ESD5D150TA),…

GEO+Agent双引擎系统源头供应:讯灵让AI成为企业增长合伙人

企业增长遇瓶颈?AI 正在重构增长路径 当前企业服务面临四大核心痛点: ❌ 营销老套成本高 ❌ 同质化竞争激烈 ❌ 新流量不敢尝鲜 ❌ 产品落地卡脖子讯灵AI以GEO+Agent双引擎系统,精准切入企业增长困局,构建“AI 推荐…

GB18030与Unicode简介

Unicode用21位‌来表示字符,即可以表示200多万个,2 ** 20 = 1048576‌UTF-8‌使用 8 位(1 字节)到 32 位(4 字节)不等的变长编码 ‌UTF-16‌使用2 字节或4 字节的编码单元 ‌UTF-32‌固定使用4 字节编码单元 Uni…

构建可持续人才生态:金风科技风电人才培养战略与实践白皮书

构建可持续人才生态:金风科技风电人才培养战略与实践白皮书 行业深度分析报告 2025年11月 目录 一、项目背景与概述 二、金风科技企业概况 三、风电人才培养体系全景 3.1 校企合作:精准培育行业生力军 3.2 行业培训:…

【ACM出版 | 往届见刊后1个月检索】第二届经济数据分析与人工智能国际学术会议 (EDAI 2025)

第二届经济数据分析与人工智能国际学术会议(EDAI 2025)将于2025年11月14日至16日召开。【经济主题皆可投递 I 国际化组委,3大Fellow支持】 【往届见刊后1个月被EI, Scopus检索,本届会议也拟申请ACM独立出版社,见刊…

nats leaf node 部署玩法

nats leaf node 部署玩法nats 的leaf node 模式是一种扩展nats 能力到边缘场景的玩法,部署上比较简单,核心是配置leaf 信息,同时可能还会有安全认证的问题 认证模式基于Nkeys的(推荐基于nsc 等工具处理) 直接配置…