什么是粗排和精排

在 RAG、推荐系统、搜索引擎等场景中,粗排(Coarse-grained Ranking)精排(Fine-grained Ranking)是一套 **“先海选、再精选”** 的两级检索排序策略,核心目的是在保证检索效率的前提下,大幅提升结果的精准度。

简单类比:

  • 粗排 = 简历初筛:HR 快速扫一遍简历,把 “学历、工作年限” 达标的候选人挑出来,不纠结细节;
  • 精排 = 复试面试:对初筛通过的候选人,深入考察专业技能、项目经验,最终确定录用名单。

在 RAG 的向量检索流程中,这套策略尤其适合海量数据场景(比如向量库中有百万 / 千万级文档片段),直接全局精排会严重拖慢速度,两级排序能兼顾 “快” 和 “准”。

一、粗排:快速筛选,缩小范围

1. 核心目标

全量向量数据中,快速筛选出与问题 “可能相关” 的候选集,过滤掉明显不相关的数据,减少后续精排的计算量。

2. 技术特点
  • 计算速度快:采用轻量级模型 / 规则,不追求高精度,只做 “快速过滤”;
    • 向量检索中:常用近似最近邻(ANN)算法(比如 Milvus 的 IVF_FLAT、HNSW),牺牲一点点精度换速度;
    • 其他场景:也可以用关键词匹配、标签过滤等简单规则(比如用户问 Spark,直接过滤掉 Hadoop 相关文档)。
  • 召回率优先:粗排要保证 “不漏掉潜在相关数据”,所以筛选条件比较宽松,候选集的数量通常是最终需要结果的10~100 倍(比如要最终返回 10 条结果,粗排先选出 200 条候选)。
3. 在 RAG 中的应用示例

假设 Milvus 中有 100 万条技术文档向量,用户提问 “Spark 宽依赖和窄依赖的区别”:

  • 粗排步骤:用问题向量通过 HNSW 算法检索,快速返回200 条候选片段(耗时毫秒级),这些片段都和 Spark 相关,但可能包含部署、调优、依赖关系等不同内容。

二、精排:精准排序,择优输出

1. 核心目标

对粗排筛选出的候选集,进行精细化相关性计算,最终按 “与问题的匹配度” 排序,选出最相关的 Top-K 结果。

2. 技术特点
  • 计算精度高:采用更复杂的模型 / 算法,深入计算 “问题与候选片段” 的语义相关性;
    • 向量检索中:常用余弦相似度、点积等精准度量方式,或引入交叉编码器(Cross Encoder)—— 专门用于计算 “文本对” 的相关性得分,比单向 Embedding 更精准;
    • 其他场景:也可以用深度学习模型(如 BERT 变体),建模问题与文本的深层语义关联。
  • 效率要求低:因为候选集已经被粗排缩小,所以即使精排算法复杂,整体耗时也可控。
3. 在 RAG 中的应用示例

对粗排选出的 200 条 Spark 相关候选片段:

  • 精排步骤 1:用 Cross Encoder 计算 “用户问题 ↔ 每个候选片段” 的相关性得分(置信度);
  • 精排步骤 2:按得分从高到低排序,选出 Top-5 最相关的片段(比如直接讲解依赖关系的文档);
  • 最终:把这 5 条片段传给大模型生成答案。

三、粗排 + 精排的完整流程(RAG 场景)

用户提问 → 问题向量化 → 粗排(ANN 检索全量数据,选出 N 条候选) → 精排(Cross Encoder 计算相关性,选出 K 条 Top 结果) → 传给大模型生成答案
阶段核心算法目标速度精度
粗排近似最近邻(HNSW/IVF)、关键词过滤快速召回候选集快(毫秒级)较低
精排余弦相似度、交叉编码器(Cross Encoder)精准排序候选集中等(百毫秒级)较高

四、为什么需要两级排序?

  • 只做粗排:速度快,但结果精度低,可能混入很多弱相关数据,影响 RAG 效果;
  • 只做精排:对全量数据逐一计算精准相似度,在海量数据下速度极慢(比如千万级数据需要几秒甚至几十秒),无法满足实时检索需求;
  • 粗排 + 精排:平衡了效率精度,是海量数据场景下的最优解。

五、实操小技巧(LangChain + Milvus 实现粗排 + 精排)

  1. 粗排:用 Milvus 的 HNSW 索引做近似检索,获取候选集;
  2. 精排:用 LangChain 的CrossEncoderReranker对候选集重新排序。
from langchain.retrievers import ContextualCompressionRetriever from langchain.retrievers.document_compressors import CrossEncoderReranker from langchain_community.cross_encoders import HuggingFaceCrossEncoder from langchain_community.vectorstores import Milvus # 1. 初始化 Milvus 粗排检索器 vector_db = Milvus(...) coarse_retriever = vector_db.as_retriever(search_kwargs={"k": 200}) # 粗排召回 200 条 # 2. 初始化精排重排器(用 HuggingFace 的 Cross Encoder 模型) model = HuggingFaceCrossEncoder(model_name="BAAI/bge-reranker-base") compressor = CrossEncoderReranker(model=model, top_n=5) # 精排选 Top-5 # 3. 组合粗排+精排 compression_retriever = ContextualCompressionRetriever( base_retriever=coarse_retriever, base_compressor=compressor ) # 4. 检索 docs = compression_retriever.get_relevant_documents("Spark 宽依赖和窄依赖的区别")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1164600.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Google Ads花钱没单?9大常见设置错误与修复指南

在数字广告投放中,Google Ads 一直是流量变现和品牌推广的重要渠道。但对于许多广告主和运营人员来说,账户的设置问题往往比创意和预算更致命。一个看似小小的参数配置错误,就可能导致广告无法触达目标人群、预算被快速消耗,甚至账…

全国冠军代言资源平台排名

【标题】:体育冠军代言哪家好:专业深度测评,排名前五揭晓【开篇】:随着体育产业的蓬勃发展,体育冠军代言成为品牌宣传的重要手段。为了帮助消费者更好地了解市场上的冠军代言资源平台,我们特此进行了深度测…

EasyGBS算法算力平台在智慧安防视频监控中的应用实践

在数字化、智能化浪潮席卷全球的今天,传统安防体系正经历着深刻的变革。随着GB28181国家标准的全面推广和实施,视频监控系统的标准化、网络化、智能化已成为智慧安防建设的必然要求。EasyGBS作为GB28181的算法算力平台,不仅解决了海量视频资源…

大模型强化学习训练全攻略:从RLHF到RLVR,算法、框架与性能优化详解

文章解析了大模型从预训练到后训练的转变,重点介绍强化学习(RL)在大模型中的应用。详细阐述了SFT、RLHF和RLVR三大训练阶段,PPO和GRPO等核心算法,以及RL训练面临的基础设施挑战,特别是混合负载问题。同时介绍了字节跳动的verl框架…

领航技术股份-水浸传感器哪家好

领航技术股份-选水浸传感器,家用看智能联动与性价比,工业级看稳定性、干接点 / 通讯适配及场景防护,以下是分场景的优质品牌与选型建议,兼顾国产与进口,覆盖主流需求。领航技术股份一、家用 / 智能家居场景&#xff08…

EasyGBS智能化视频监控助力企业安全运营

在商业快速扩张的背景下,连锁店门店数量激增,分布范围广。但传统人工巡检等管理方式效率低下,存在信息滞后、管理盲区,难以掌握店铺运营情况,影响企业效率与安全。作为一体化智能视频监控的国标GB28181算法算力平台Eas…

靠谱的厌氧池清淤哪家妙

《厌氧池清淤哪家好:专业深度测评排名前五》开篇:定下基调随着环保要求的不断提高和污水处理设施的持续建设,厌氧池清淤作为污水处理过程中的关键环节,其专业性和高效性日益受到重视。本次测评旨在为广大企业和环保单位提供一份客…

WHAT - Vercel react-best-practices 系列(一)

文章目录 前言 Guidelines Critical Patterns 1. Eliminate Waterfalls(消灭瀑布流) Defer await until needed 核心问题 反例:无论是否需要,先 await 推荐:await 放进条件分支 典型业务场景 本质总结 Use Promise.all for independent async operations 核心问题 反例:人…

数据合规律师必考七大证书:全面提升职场竞争力

在企业的数字化转型浪潮中,数据合规已成为法律人不可忽视的业务蓝海。随着《数据安全法》《个人信息保护法》等法规的深入实施,数据合规人才需求爆发性增长,具备专业资质的法律人才薪资平均比普通法务高出400%。一、CISP(注册信息…

AI大模型全景指南,从小白到程序员的完全学习手册

AI大模型作为新一代人工智能核心驱动力,已进入应用与智能体时代。产业链分为基础层(算力、数据、算法、云服务)、模型层(通用/行业大模型、MaaS)和应用层(To B/C场景),配以支撑服务提…

救命!挖到就业黄金赛道!2025 网安缺口 327 万,零基础入门到精通,收藏即通关!

《信息安全毕业主推的6大岗位(2025真实版)》 **关于我:资深IT专家,AI布道者,15年实战老兵多本专业图书作者大厂技术面试官。 ** 根据2024年官方公布的数据显示,到2027年我国网络安全人员缺口将达327万。 尽管全国已有6…

携手订单日记,圣力树开启智能升级之路

一、客户背景 惠州圣力树工艺品有限公司,成立于2016年,位于广东省惠州市惠阳区,是一家以从事销售圣诞制品、工艺品等产品为主的企业。 在业务不断壮大的过程中,面临生产效率低、统计数据麻烦等问题,需要一种既能提升运…

国家战略急需!网安工程师年薪真能过百万?好不好入行一篇说透!

针对时下大火的“网络安全工程师”,网络出现不少相关报导和信息: 下面就来跟大家分享一下网络安全工程师工资待遇,给大家作为一个参考。 不同工作经验的待遇水平 其中应届生工资¥6070,1-3年工资¥8820,3-5年工资&…

基于社区宠物管理

基于社区的宠物管理系统设计与实现 第一章 系统整体架构设计 基于社区的宠物管理系统以“规范饲养、安全保障、邻里和谐”为核心目标,采用“前端交互-后端服务-数据管理”三层架构。系统核心包含五大功能模块:宠物档案管理模块、免疫接种模块、社区活动模…

8个降AI率工具推荐!研究生高效降AIGC神器合集

8个降AI率工具推荐!研究生高效降AIGC神器合集 AI降重工具:论文优化的高效助手 在当今学术研究日益依赖人工智能辅助写作的背景下,如何有效降低AIGC率、去除AI痕迹并保持论文的原创性,成为研究生们必须面对的挑战。随着各大高校对A…

基于ASP.NET及HTML的高校官网设计

基于ASP.NET及HTML的高校官网设计 第一章 系统整体架构设计 基于ASP.NET及HTML的高校官网以“信息公开、服务师生、塑造形象”为核心目标,采用“表现层-业务逻辑层-数据访问层”三层架构。系统核心包含六大功能模块:首页展示模块、学校概况模块、教学科研…

网安冰火两重天:480 万缺口下,裁员潮 + 一线饱和 + 二三线降薪 30%,核心缺高端实战人才!

上海网络安全人才的就业格局:高端人才争夺激烈但门槛高,基础岗位门槛降低且同质化加剧,安全威胁复杂化与合规压力同步攀升。 2025年上海网络安全岗位招聘量为1853个,较2023年增长8%。行业集中于互联网(31%)…

告别文献 “乱炖”!宏智树 AI 手把手教你写出有灵魂的文献综述

作为深耕论文写作科普的教育博主,后台总能刷到这样的求助:“读了几十篇文献,写出来的综述像‘大杂烩’”“观点堆砌没逻辑,被导师批‘没找到研究缺口’”“参考文献格式错一堆,查重率还居高不下”。文献综述不是简单的…

UE5 C++(32):进度条 Progress 的实现

(171) (172) 谢谢

【拯救HMI】HMI国际化设计:多语言界面的十大注意事项

在全球化制造的今天,一台由中国设计的设备可能安装在德国工厂,由越南操作员使用。HMI的国际化(i18n)与本地化(L10n)设计,是产品成功进入国际市场的“通行证”,其核心目标是消除语言障…