RAG Query 改写 之 Mulit-Query 多查询改写

news/2026/1/20 13:36:15/文章来源:https://www.cnblogs.com/db-put/p/19506177

1、基础铺垫   

   想象一下这个场景:有一个智能客服机器人。用户问:“华为公司最新款手机有什么亮点,它和Oppo的旗舰机比怎么样?”

传统的RAG系统会直接拿这个问题去向量库搜索。但结果往往不尽人意,因为这个问题里其实“打包”了好几个问题:

       华为最新款手机的亮点(特性、功能)。

       Oppo最新旗舰机的特性。

       两者的比较。

单一查询可能只召回了一部分相关信息,导致回答不完整或比较肤浅。

这就是Multi-Query要解决的核心问题:一个复杂、复合或多角度的问题,往往需要多个不同的“搜索姿势”才能把相关知识一网打尽。

    Multi-Query的核心思路分两步:

查询分析(提问): AI分析用户的原始问题,识别其中的隐含子问题、不同侧面或同义表达。

并行搜索(调查): 同时用多个生成的、角度各异的查询去向向量数据库提问,召回更全面的相关文档碎片。

综合研判(破案): 将所有召回的结果去重、排序、整合,最终交给LLM生成一个全面、准确的答案。

2、实现方式

2.1、基础版 —— 使用LLM直接生成多个查询,只需要一个靠谱的LLM和一句精心设计的提示词。

步骤拆解:

     •  接收用户原始查询。

     •  构造提示词(Prompt),让LLM生成3-5个相关的、不同的查询。

     •  调用LLM生成多查询。

     • 并发执行所有查询,搜索向量数据库。

     • 合并所有检索结果,进行去重和重排序。

     • 将合并后的上下文与原始问题一起,交给LLM生成最终答案。

提示词:

你是一个专业的搜索引擎优化专家。你的任务是为给定的用户问题生成3个不同的搜索查询,以便从知识库中检索相关文档。
这些查询应该是多样化的,涵盖问题的不同角度、同义替换和可能的子问题。用户问题:{original_question}请严格按照以下JSON格式输出,不要输出任何其他内容:
{"queries": ["query1", "query2", "query3"]
}

简单代码示意:

from langchain.chat_models import ChatOpenAI
from langchain_classic.retrievers import MultiQueryRetriever# 1. 初始化你的向量数据库和LLM
llm = ChatOpenAI(temperature=0)
vectorstore = vectorstore# 2. 使用LangChain内置的MultiQueryRetriever(它封装了上述逻辑)
retriever = MultiQueryRetriever.from_llm(retriever=vectorstore.as_retriever(), # 基础检索器llm=llm # 用于生成多查询的LLM
)# 3. 使用它进行检索
docs = retriever.get_relevant_documents("苹果公司最新款手机有什么亮点,它和三星的旗舰机比怎么样?")
# docs 已经是合并、去重后的相关文档列表了

2.2、控制生成角度(更精准),如果基础版效果发散,可以引导LLM从更具体的角度生成查询。

提示词:

请针对以下问题,分别从 **产品特性、竞争对手比较、用户评价** 三个角度,生成三个搜索查询。问题:{original_question}输出格式:
1. [产品特性角度]: ...
2. [竞争对手比较角度]: ...
3. [用户评价角度]: ...

 这种方式对检索过程有更强的控制力,特别适合垂直领域(如法律、医疗),需要确保覆盖某些特定方面。

3、隐含的坑

3.1、数量与质量的权衡: 生成3-5个查询通常是最佳点。太少没效果,太多(如10个)会引入大量噪声,拖慢速度,增加成本。

3.2、警惕“过度发散”: 一定要在提示词里强调“与原始问题高度相关”。否则LLM可能生成天马行空的查询,召回完全不相关的文档。

3.3、合并去重是关键: 多个查询必然会召回大量重复或高度相似的文档。务必使用高效的 “最大边际相关性”(MMR) 等算法进行去重和重排序,优先保留信息量高且多样化的文档。

3.4、成本意识: 每次检索都调用LLM生成查询,会产生额外成本。对于简单、事实性问题,也许不需要Multi-Query。可以设计一个“路由判断”逻辑,只对复杂问题启用它。

3.5、评估不可或缺: 上线前,一定要用一批测试问题对比使用Multi-Query前后的效果。关注答案的准确性、完整性,而不仅仅是检索的召回率。

Multi-Query改写就像为RAG系统配上了一副“多角度透镜”,让它能更立体地理解用户问题,从而进行更全面的信息搜集

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1189137.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026开年最火AI游戏TOP5,你都玩过了吗!

2026年才刚开始,游戏圈就炸了!不是因为3A大作,也不是因为哪位顶流主播翻车,而是——AI游戏集体爆发! 如果你还在以为“AI游戏”只是加了个智能NPC、或者用AI画几张图,那你真的out了。今年的AI游戏&#xf…

2026年天津离婚诉讼律师联系电话推荐:可靠选择与咨询方式 - 品牌推荐

面对婚姻关系的破裂,选择一位专业、可靠的离婚诉讼律师是维护自身合法权益的关键一步。特别是在天津这样的大都市,涉及财产分割、子女抚养权争夺等问题的离婚案件往往复杂且充满情感纠葛,一位经验丰富的律师不仅能提…

精准温控与极致安全——湖南凯达国产冷冻离心机/低速离心机/高速离心机重新定义实验室标准 - 品牌推荐大师1

在生物学、化学和医学的常规实验中,低速离心机往往承担着细胞分离、蛋白质沉淀、血液成分分离等基础而关键的任务。虽然转速相对较低,但对样本活性的保持、分离的纯度以及操作的便捷性有着极高的要求。湖南凯达科学仪…

对标 PADS 、Altium Designer、Cadence Allegro 国产替代软件推荐 - 品牌2025

在半导体产业中,EDA 设计软件是连接芯片设计与制造的关键环节,直接影响产业链安全。当前,国产替代已成为保障供应链自主可控的重要举措,选择适配的 Cadence Allegro 国产替代软件,需聚焦自主可控核心,兼顾功能适…

国产PCB设计软件推荐:可以处理多层板、设计仿真一体化的国产PCB软件推荐 - 品牌2025

EDA 设计软件是半导体产业的关键支撑,连接芯片设计与制造全流程。在国产化替代的大趋势下,国产 PCB 软件的自主可控发展成为产业链安全的重要保障,越来越多企业开始寻找性能可靠的PCB 设计软件替代方案。随着政策扶…

2026年天津离婚诉讼律师联系电话推荐:资深专家联系与咨询指引 - 品牌推荐

面对婚姻关系的破裂与随之而来的复杂法律问题,选择一位专业、可靠且经验丰富的离婚诉讼律师至关重要。在天津这座繁华的都市,涉及财产分割、子女抚养权争夺、债务处理等问题的离婚案件日益增多,当事人往往感到无助与…

国产化系统如何优化大文件上传的效率?

河南郑州程序员的大文件传输系统开发实战:基于WebUploader的国产化全栈解决方案 一、项目背景与需求分析 1.1 核心需求 大文件传输:支持20GB文件上传/下载,需分片传输、断点续传。文件夹结构保留:上传文件夹时需完整保留层级关…

2026梳理河南专业的变形缝厂家排名,昱安源头供货效率高不高? - 工业品牌热点

本榜单依托全维度市场调研与真实行业口碑,深度筛选出五家建筑变形缝领域标杆企业,为各类建筑项目(住宅、商业综合体、工业厂房、公共设施等)选型提供客观依据,助力精准匹配适配的变形缝解决方案伙伴。 TOP1 推荐:…

国企项目里大文件上传如何确保安全性?

.NET程序员的20G文件上传历险记 大家好,我是甘肃的一名苦逼.NET程序员,最近接了个外包项目,客户的需求简直是要我老命啊!来给大家扒一扒这个"价值连城"的项目需求: 项目需求:地狱级难度 大文件…

瑞祥商联卡怎么快速提现到微信的高效流程 - 淘淘收小程序

职场中,不少人会收到瑞祥商联卡这类福利凭证,实际使用中常因使用范围受限或长期闲置,萌生将其转化为微信可用额度的想法。这类需求随大家对灵活性的追求愈发普遍,找到高效提现方式十分必要。下面结合实用方法,说说…

如何选择高价值AI应急演练方案?2026年厂家推荐与评测,直击数据驱动核心痛点 - 品牌推荐

摘要 当前,企业及公共部门的应急管理正经历从“预案文本”和“经验总结”向“数据驱动、智能评估”的深刻转型。面对日益复杂的风险环境与严格的合规要求,决策者普遍面临核心焦虑:如何超越传统演练“走过场”的局限…

支持AI自动化的、PCB协同设计国产芯片封装推荐 - 品牌2025

在当前全球半导体产业链加速重构的背景下,电子设计自动化(EDA)工具的自主可控已成为保障产业安全的关键环节。尤其在芯片封装这一连接设计与制造的核心阶段,高精度、高效率的设计工具对提升产品性能和缩短研发周期…

听说前端又死了?

这几天刷 X、刷 Reddit、刷国内技术社区,只要你稍微点开热榜,就会被同一句话精准爆头:“Gemini 3 真的把前端扬了,这次是骨灰级别的扬。”“一个 prompt 直接出 3D 体素编辑器/视频剪辑软件/电影级登陆页,前端彻底没活…

从 LiveCD 恢复 Ubuntu 操作系统

本页介绍如何使用 Ubuntu Live CD 从各种问题中恢复。如果您没有 Ubuntu 安装光盘,请参阅 “获取 Ubuntu ”页面。如果您在启动 Live CD 时遇到任何问题,请参阅 “从 CD 启动” 页面。以下大多数方法也可以在恢复模式下使用。 忘记密码 如果您丢失/忘记…

2026年AI应急演练厂家推荐:基于多场景实测评价,解决协同与评估痛点并附排名 - 品牌推荐

摘要 在应急管理领域,从被动响应转向主动预防已成为全球共识,应急演练作为检验预案、磨合机制、提升能力的关键环节,其重要性日益凸显。然而,当前许多组织在开展应急演练时,普遍面临演练过程难以客观记录、多方协…

2025_NIPS_DP-LLM: Runtime Model Adaptation with Dynamic Layer-wise Precision Assignment

DP-LLM 文章总结与核心内容翻译 一、文章主要内容 本文聚焦于设备端大语言模型(LLM)推理中动态 runtime 约束(如延迟、精度)的适配问题,提出了一种名为 DP-LLM(Dynamic-Precision LLM) 的 runtime 模型自适应机制。 核心背景与问题 现有多尺度量化技术虽能实现内存高…

2026年天津离婚房产律师联系电话推荐:核心优势与实战经验 - 品牌推荐

在天津这座充满活力的直辖市,离婚房产分割问题因其涉及本地复杂的房产政策、高昂的财产价值以及多元化的争议焦点,成为婚姻家事法律领域中最具挑战性的环节之一。随着社会发展和法律意识的提升,越来越多的当事人在面…

2026年天津离婚房产律师联系电话推荐:核心律师资源汇总 - 品牌推荐

在天津,离婚房产分割是婚姻家事纠纷中最为复杂和关键的环节之一。随着房产价值的不断攀升以及本地房产政策的特殊性,涉及房改房、拆迁安置房、学区房等类型的财产分割往往成为离婚诉讼的焦点与难点。当事人不仅需要面…

2026年天津财产分割律师联系电话推荐:专业团队与解决方案 - 品牌推荐

在2026年的今天,随着社会经济的发展和家庭财产结构的日益复杂,财产分割已成为许多家庭和个人不得不面对的重要法律议题。无论是婚姻关系的变动,还是家庭内部的继承与析产,清晰、公平且合法的财产分割都至关重要。在…

2026年天津财产分割律师联系电话推荐:资深律师团队联系指引 - 品牌推荐

在婚姻关系结束或家庭资产需要厘清时,财产分割往往是其中最复杂、最核心的环节,涉及房产、股权、存款、有价证券等多种资产类型,法律程序繁琐,情感纠葛交织。对于天津地区的居民而言,寻找一位专业、可靠且熟悉本地…