【RAG召回排序】2025最全排序模型梳理

2025年检索重排模型全景盘点:从顶尖榜单到实用工具

在检索增强生成(RAG)和智能搜索领域,检索与重排模型的性能直接决定了系统的最终效果。今天我们就从权威排行榜出发,盘点当前最受关注的模型与工具。


一、权威检索重排排行榜速览

目前业内最受关注的两大检索重排模型排行榜分别是:

  • BGE-Reasoner 榜单(https://github.com/VectorSpaceLab/agentic-search/tree/main/BGE-Reasoner):由向量空间实验室维护,聚焦于具备推理能力的检索模型,其榜单数据直接反映了模型在复杂场景下的信息筛选能力。
  • Bright Benchmark(<https://brightbenchmark.github.io):一个综合性的检索模型评测平台,通过多维度的数据集和严格的评估指标,为研究者和开发者提供模型性能的客观对比。

这两个榜单是当前检索重排领域的风向标,能够帮助我们快速定位最前沿的技术成果。


二、Bright Benchmark 前五名深度解析

1. INF-X-Retriever(INF)

  • 核心亮点:以63.4的总分大幅领先第二名,在榜单上形成断层优势,展现出碾压级的性能。
  • 注意事项:目前仅支持英文场景,中文任务中无法直接使用,但其技术思路值得关注。

2. DIVER-v3-GroupRank(Ant Group & Sun Yat-sen University)

  • 核心亮点:由蚂蚁集团与中山大学联合研发,以46.8分位居第二。它创新性地引入了分组排序机制,在处理大规模候选集时具备更优的效率与效果。
  • 技术价值:其论文(https://arxiv.org/abs/2508.07995)详细阐述了分组策略的设计思路,对工业界落地具有重要参考意义。

3. BGE-Reasoner-0928(USTC & BUPT & BAAI)

  • 核心亮点:由中国科学技术大学、北京邮电大学与北京智源人工智能研究院联合推出,是兼具推理能力与检索精度的代表模型。
  • 生态价值:它不仅在榜单上表现优异,还拥有完整的开源生态(https://github.com/VectorSpaceLab/agentic-search/tree/main/BGE-Reasoner),便于开发者进行二次开发与部署。

4. Lattice Hierarchical Retrieval(UT Austin & UCLA & Google)

  • 核心亮点:由德克萨斯大学奥斯汀分校、加州大学洛杉矶分校与谷歌团队共同开发,采用独特的分层格子结构,能够高效处理多粒度的语义信息。
  • 开源支持:项目已开源(https://github.com/nilesh2797/lattice),其分层检索的架构设计为处理复杂长文本提供了新的技术路径。

5. ReasonRank (rerank RaDer)(RUC & Baidu & CMU)

  • 核心亮点:由中国人民大学、百度与卡内基梅隆大学联合打造,是一款专注于重排任务的模型,通过对召回结果的二次精排,显著提升最终检索的准确率。
  • 技术定位:它证明了在检索流程中,“重排”环节对最终效果的决定性作用,与“召回”环节同等重要。

三、其他值得关注的模型与工具

🌟 行业标杆与创新突破

  • hifi-rag:NeurIPS 2025冠军模型,其核心创新在于用大模型做内容过滤,打破了“唯召回率论”的行业惯性,强调“过滤效果才是提升RAG性能的关键”。
  • Youtu-Embedding:在CMTEB(中文多模态嵌入基准)榜单上效果最好的中文嵌入模型,是处理中文场景的首选方案之一。
  • ReasonEmbed:与BGE-Reasoner同属一个开源生态,专注于生成具备推理能力的文本嵌入,为后续的检索与重排提供了高质量的语义基础。

🛠️ 实用工具与衍生模型

  • jina-embedding:由Jina AI推出的轻量级嵌入模型,以高效的部署体验和稳定的性能,在开发者社区中广受好评。
  • conan-v1:一款新兴的重排模型,通过结合上下文感知的注意力机制,在动态场景下展现出出色的自适应能力。
  • Yuan-embedding-2.0-zh:其创新的训练范式值得研究,尤其在处理低资源语言和领域适配场景时,提供了新的技术思路。

📊 经典与生态工具

  • cross-encoder/stsb-roberta-base:经典的交叉编码器模型,在语义相似度计算任务中表现稳定,是许多重排系统的基线选择。
  • ColBERT:通过交互式注意力机制实现细粒度的语义匹配,是学术界和工业界都广泛认可的检索模型。
  • Qwen带提示词重排:基于通义千问大模型的重排方案,通过精心设计的提示词工程,充分释放大模型的推理能力来优化排序结果。
  • SBERT:经典的语义相似度模型,其论文(https://arxiv.org/abs/1908.10084)被引次数极高,至今仍是构建语义检索系统的基石。

🧩 Milvus 生态工具

  • Phrase Match:Milvus的短语查询功能,支持多个关键词短语的精确匹配,非常适合需要精准定位关键词的检索场景。
  • zilliz/semantic-highlight-bilingual-v1:Milvus推出的语义高亮模型,通过对召回结果的token级打分,能够更细粒度地计算句子与查询的相似度,提升检索结果的可解释性。

我可以帮你整理一份检索重排选型对照表,把这些模型的核心特点、适用场景和优缺点都列出来,方便你快速做技术选型。需要吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1170131.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nature发表、Science点赞!清华揭秘AI让科学家走捷径却让科学走窄路

AlphaFold获得诺贝尔奖标志着人工智能工具已深入科学的核心地带。清华大学一项基于41,298,433篇论文的深度研究揭示了一个令人深思的悖论。AI显著提升了科学家的个人产出与职业进程&#xff0c;却导致整个科学探索的领域变得狭窄且固化。该研究发表在Nature上&#xff0c;而且被…

AI技术唾手可得的时代,挖掘新需求是产品突围的关键——某知名聚合DNS管理系统的需求洞察

a.内容描述 核心功能定位&#xff1a;该项目是一个聚合DNS管理系统&#xff0c;旨在为用户提供一个统一的Web界面&#xff0c;集中管理分布在多个主流云服务商和DNS服务平台的域名解析记录。其核心定位是解决用户在多平台间切换管理DNS解析的繁琐问题。关键应用场景&#xff1a…

编程已终结!AI时代的原生智能软件架构长啥样?Claude给了个指南

近期&#xff0c;完全由 Claude code 自主编程开发软件已经成为现实&#xff0c;人们惊呼编程已经终结&#xff0c;该领域的奇点已至&#xff1a;革了程序员再革打工人&#xff1a;Anthropic 发布 Cowork&#xff0c;Claude Code 走进数字办公自动化。 那AI时代的软件应该如何…

安卓神器 --- 浏览器 之 yandex 狐猴浏览器 chrome firefox

安卓神器 --- 浏览器 之 yandex 狐猴浏览器 chrome firefox安卓神器 --- 浏览器 之 yandex 狐猴浏览器 chrome firefox

P11714 [清华集训 2014] 主旋律 Sol

计数神题。 题目链接 前言 这篇题解没有什么特别的,纯粹是快速题解区变换。仅在一些地方加上了自己的理解,希望会有所帮助。 做本题之前,可以先看看P6846 [CEOI 2019] Amusement Park,可能会有所启发。 解题思路 D…

GD5F1GM7UEYIGR:兆易创新1Gbit SPI NAND闪存,高效低功耗

品牌&#xff1a;兆易创新(GigaDevice) 型号&#xff1a;GD5F1GM7UEYIGR 容量&#xff1a;1Gbit 产品类型&#xff1a;NAND FLASH 接口类型&#xff1a; 标准SPI接口&#xff0c;支持1、2、4线模式。这意味着它只需要极少&#xff08;通常6-7个&#xff09;的GPIO引脚即可实…

夏天还不算开始——我,不会退役

或许每个人都会遇到吧,起起落落才是常态。一切过往,皆为序章。 :::align{right} ——莎士比亚 :::十月底,浙江从夏入冬,没有秋天。桂花?夹在冷热间开了一个星期,落完了。 具体经历,我不想回忆了。 2025/11/1 mo…

4B超越8B比肩30B!清华、面壁智能端侧智能体天花板开源

清华大学自然语言处理实验室&#xff08;THUNLP&#xff09;、中国人民大学、面壁智能&#xff08;ModelBest&#xff09;与OpenBMB开源社区联合发布并开源了端侧智能体模型AgentCPM-Explore。该模型仅凭4B参数规模便在深度探索类任务上取得了同尺寸模型的SOTA&#xff08;Stat…

企业软件供应链安全治理立项,方案书/立项书该怎么写?

当CTO或安全负责人指示“今年要把软件供应链安全做起来”时&#xff0c;很多项目负责人往往会陷入迷茫&#xff1a;“到底是应该买个SCA工具扫一扫&#xff1f;还是建立一套复杂的流程呢&#xff1f;我的项目立项书/方案书到底应该怎么写&#xff1f;后续的落地要怎么规划呢&am…

[Non] 字符串问题

字符串问题 大意 插入字符,查询字符。 初始串 \(s\), \(|s| \le 10^6\)。 思路 可以用平衡树,但是我选择更为强势的 STL 中的 rope。 头文件:#include<ext/rope> crope r1; // 存储 char 的 rope w…

谷歌Veo 3.1更新:更一致性、更具创造力和控制力

刚刚&#xff0c;谷歌Veo 3.1发布更新。通过素材转视频功能&#xff0c;实现了角色身份、背景与物体在动态场景中的高度一致性&#xff0c;并首次支持原生竖屏生成与4K超分画质&#xff0c;彻底打通了从静态图像到专业级动态叙事的创作链路。三大更新都是当前市场需求最大的领域…

评正高写书10万字什么价格?

评正高写书10万字什么价格&#xff1f; 评正高专著要求多少字&#xff1f; 下面淘淘论文来回答作者的这个疑问。一、评正高专著要求同样是评正高职称&#xff0c;要求有一定差异。一般评正高职称&#xff0c;对于专著的要求分为这几种情况&#xff1a;&#x1f539;独著或者合著…

Day15对象的方法与遍历对象

方法:<!DOCTYPE html> <html lang="en"><head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"…

SCI分区是怎么划分的?

SCI分区是怎么划分的&#xff1f;SCI期刊的一区、二区、三区、四区是怎么分区的&#xff1f;很多作者知道SCI有几个分区&#xff0c;但是不知道期刊的分区标准。下面淘淘论文来回答作者的这个疑问。一、SCI期刊分区划分的原因SCI期刊数量有9000多种&#xff0c;而SSCI期刊有300…

深圳ACFlow智能营销系统:2026年中小企业AI驱动营销新范式

## 智能营销系统:2026年企业增长的数字化引擎在数字经济浪潮下,**智能营销系统**已成为企业提升市场竞争力、实现精准获客的核心工具。根据艾瑞咨询《2026年中国营销科技(MarTech)行业研究报告》显示,中国营销科技…

工业级文本转SQL新思路:成本暴降、超3000列超大数据库依然稳健

像一位经验丰富的数据库工程师那样去思考和探索&#xff0c;才是解决工业级文本转SQL&#xff08;Text-to-SQL&#xff09;难题的终极答案。华中科技大学与复旦大学联合发布了AutoLink框架&#xff0c;通过引入自主智能体&#xff0c;模拟人类工程师“探索-验证-迭代”的工作流…

ACP:2.从一个 .NET 实战开始,看 Agent 带来的真实差异

ACP:2.从一个 .NET 实战开始,看 Agent 带来的真实差异 在上一篇文章中,我们聊了 ACP 想解决的核心问题:当 AI 工具越来越多,Agent、Prompt、MCP、Skills 已经变成一种需要被管理的工程能力。这一篇,我们不再讲理…

C++跨平台开发挑战的技术

跨平台开发概述C作为跨平台语言的优劣势分析常见跨平台场景&#xff08;Windows/macOS/Linux/嵌入式等&#xff09;跨平台开发的核心目标&#xff1a;代码复用与一致性体验技术挑战与解决方案编译器与标准兼容性问题不同平台编译器&#xff08;GCC/Clang/MSVC&#xff09;对C标…

万卡的部署架构

目录一、理解题意二、回答思路(Step by Step)1️⃣ 量化和模型副本2️⃣ 模型并行策略3️⃣ 推理请求调度4️⃣ 弹性伸缩和高可用5️⃣ 核心要点总结(面试回答模板) 好的,这类面试问题,本质是在考察你对 大模型生…

IDM插件开发创意赛

引言IDM&#xff08;Internet Download Manager&#xff09;插件开发的意义与价值创意赛的背景与目标参赛者的技术门槛与预期成果IDM插件开发基础www.yunshengzx.comIDM插件架构与核心功能开发环境配置&#xff08;工具链、SDK、文档资源&#xff09;插件与IDM的交互机制&#…