收藏!从传统RAG到知识图谱+Agent,蚂蚁集团实战:知识库AI问答成功率突破95%

引言

本文整理自5月底QECon深圳站的重磅分享——蚂蚁集团知识库领域专家带来的「企业级领域知识管理与AI问答落地实践」。分享中详细拆解了从传统RAG方案起步,逐步融合知识图谱、迭代式搜索Agent,最终将知识库问答正确率从60%稳步提升至95%的完整路径。作为长期深耕企业级RAG应用的开发者,这份来自一线大厂的实战经验干货满满,无论是刚入门大模型的小白,还是寻求技术突破的程序员,都值得仔细研读!

知识库问答的核心业务场景

蚂蚁集团的AI问答助手聚焦企业内部研发知识库,核心目标是降低研发人员因处理咨询工单产生的重复人力消耗。要知道,该场景下月度咨询工单量高达数万条,覆盖前后端开发、测试部署、故障排查等多个研发环节,传统人工响应模式不仅效率低,还会占用研发人员的核心工作时间。

而这类场景的核心痛点的是:问题类型分散、专业术语密集、部分问题需要跨文档关联才能解答,这也为后续技术方案的迭代指明了方向。

传统RAG的优化与瓶颈

做知识库问答,RAG是绕不开的基础框架。蚂蚁团队的实践也从传统RAG方案起步,逐步完成全链路优化。

传统RAG的完整链路优化

传统RAG的核心分为离线处理和在线检索生成两大环节,蚂蚁团队在每个环节都做了精细化打磨:

  • 离线文档处理:支持多格式文档解析(PDF、Markdown、Word等)、长文档智能分片(避免上下文断裂)、文本/段落/句子三级摘要(提升后续检索效率)、基于行业大模型的Embedding生成与向量库入库。
  • 在线检索生成:前置意图识别(区分事实查询、流程咨询、故障排查等)、口语化问题改写(适配专业文档)、稀疏+稠密多路检索、Rerank重排序(提升相关文档优先级)、基于Qwen14B的答案生成与话术优化。

优化后的核心指标

经过多轮调优和实测,传统RAG方案最终达成:

  • 文档召回率80%+(能找到大部分相关文档)
  • 最终生成正确率60%+(答案符合实际需求)

作为同样做过企业内RAG问答项目的开发者,笔者深深共鸣:传统RAG的优化过程就是「细节堆出来的效果」,从分片策略到Embedding模型选择,再到Rerank算法调优,每一步都需要大量实测验证,而蚂蚁团队给出的60%+正确率,也和行业内传统RAG的普遍天花板高度一致,这也让后续的技术突破更具参考价值。

传统RAG的三大核心瓶颈

尽管达成了80%+的召回率,但在实际业务中,传统RAG依然无法满足需求,核心问题集中在三点:

  1. 跨文档关联能力弱:研发场景中很多问题需要结合多篇文档(如「某接口的参数规范+调用示例+异常处理方案」),传统RAG难以建立文档间的语义关联;
  2. 复杂需求无法覆盖:用户需求逐渐从「单一事实查询」转向「流程型、推理型问题」(如「如何基于现有框架搭建微服务并解决分布式事务问题」),需要多步骤推理+工具辅助;
  3. 知识资产无结构化:文档多为非结构化文本,知识分散在不同文档中,检索时只能基于关键词或语义匹配,无法利用知识间的逻辑关系,效率低下。

破局关键:知识图谱+DeepSearch双轮驱动

针对传统RAG的瓶颈,蚂蚁团队提出了「知识图谱+DeepSearch」的融合方案,既解决知识结构化问题,又提升复杂场景的检索能力:

  1. 基于轻量化LightRAG框架构建领域知识图谱,打通跨文档语义关联,解决知识「散、乱、无关联」的问题;
  2. 引入DeepSearch迭代式搜索方案,让大模型自主决策检索策略,综合多源检索结果,提升复杂问题的解答能力。

知识图谱:让知识从「无序」变「有序」

知识图谱的核心价值是将非结构化的文档转化为结构化的「实体-关系」网络,让检索从「文本匹配」升级为「语义关联查询」。蚂蚁团队在知识图谱构建和检索上的实践值得重点关注:

知识图谱构建:动态、增量、精准

  1. 动态实体抽取:融合企业内部研发领域术语库(如接口名、框架组件、故障类型等)与LLM的实体识别能力,采用「规则+模型」的混合方案,既保证实体识别的准确性,又能实时捕捉新增术语,支持动态更新;
  2. 关系标签自动抽取:基于用户历史查询行为、工单反馈数据优化关系标签权重(如「接口A-依赖-框架B」的关联权重,根据查询频次动态调整),同时支持增量更新,无需全量重建图谱。

知识图谱检索:Local+Global双维度覆盖

  1. Local检索:根据用户问题快速定位相关实体子图(如查询「接口C的参数」,直接定位「接口C」相关的实体及关联关系),大幅提升检索效率和召回精准度;
  2. Global检索:利用关系标签驱动的语义扩展(如从「分布式事务」扩展到「Seata」「2PC」「TCC」等关联实体),完美解决跨文档关联问题。

最终,结合传统RAG检索、Local图谱检索、Global图谱检索的混合方案,文档召回率直接突破95%+,为后续高正确率问答奠定了基础。

DeepSearch Agent:让检索具备「推理能力」

如果说知识图谱解决了「找得到」的问题,那么DeepSearch Agent就解决了「会找、能解决复杂问题」的核心诉求。蚂蚁团队的Agent方案并非简单的工具调用,而是围绕「迭代式检索」和「领域定制化」展开:

优化1:迭代式检索框架——让大模型自主选工具

DeepSearch将多种检索能力封装为独立工具,包括:

  • 传统检索工具:稀疏检索(BM25)、稠密检索(Embedding);
  • 图谱检索工具:Local子图检索、Global关联检索;
  • 领域专属工具:代码检索(针对研发文档中的代码片段)、工单检索(关联历史已解决工单)。

大模型作为Agent的「大脑」,会根据用户问题和每一轮的检索结果,自主判断:是否需要继续检索?下一步该调用哪个工具?比如用户问「如何解决XX框架的连接超时问题」,Agent可能会先调用图谱检索找到「XX框架-关联-连接超时」的相关实体,再调用工单检索查找历史解决方案,最后结合文档检索补充细节,形成完整答案。

优化2:领域定制化——让Agent更懂研发场景

针对企业研发知识库的专业性,Agent还做了四层定制化优化:

  1. Query深度理解:通过领域大模型对问题进行意图分类、核心实体提取,甚至识别隐藏需求(如用户问「接口调用失败」,可能隐含「需要排查参数、权限、依赖服务」等潜在需求);
  2. 上下文重写:结合历史对话上下文和知识图谱,将口语化查询改写为专业检索词(如「这个接口怎么传参」改写为「XX接口的请求参数格式及必填项」),提升匹配度;
  3. 工具调用优化:预设领域工具调用模板(如代码检索需指定语言、版本,工单检索需限定时间范围),减少无效调用;
  4. 专业术语对齐:利用知识图谱中的领域术语库,解决「口语化表达 vs 专业文档」的匹配鸿沟(如「断连」对应「连接超时」「会话中断」等专业表述)。

业务落地:数据说话,泛化性拉满

经过知识图谱+DeepSearch Agent的双重优化,该方案在蚂蚁集团内部落地后取得了显著成效:

  • 复杂问题解决率提升40%+(如跨文档、推理型问题);
  • 平均响应时间缩短至2秒内(比传统RAG快30%);
  • 月度人工工单量降低10%,相当于为研发团队节省数千小时的重复沟通时间;
  • 覆盖前后端开发、测试、运维、安全等全技术栈平台,证明方案具备强泛化性,可迁移至其他领域知识库。

开发者必读:我的实战感悟与技术思考

作为长期关注RAG与大模型应用的开发者,这次分享让我深受启发,也有几点思考想和大家交流:

  1. GraphRAG是高正确率的关键:在此之前,公开可查的高准确率RAG案例并不多——Linkedin曾分享过基于Knowledge Graph的RAG召回率达85%+,后来Microsoft的GraphRAG方案引爆行业。而蚂蚁集团的实践再次证明,GraphRAG是突破传统RAG瓶颈的核心方向,95%的正确率足以支撑企业级核心业务;
  2. 复杂度与性价比的平衡:GraphRAG的搭建确实比传统RAG复杂,涉及知识图谱构建、实体关系抽取、增量更新等环节,且token消耗更高。但对于企业级场景而言,「正确率」直接关联人力成本节省和用户体验,这种投入是值得的。建议中小团队可从LightRAG这类轻量化框架入手,逐步迭代;
  3. Agent是未来趋势:GraphRAG解决了「找得准」,但要真正解决复杂用户诉求,必须结合Agent的「推理能力」和「工具调用能力」。蚂蚁的DeepSearch Agent正是通过「迭代式检索」让大模型具备了「思考过程」,这或许是未来知识库问答的终极形态;
  4. 实战大于理论:蚂蚁团队的方案之所以有价值,在于其落地性——从传统RAG的每一步优化,到知识图谱的动态构建,再到Agent的领域定制,都围绕真实业务场景展开。对于开发者而言,与其纠结技术选型,不如先动手落地最小可行版本,再根据实际问题迭代。

附:实用资料推荐

文中提到的轻量化知识图谱构建框架LightRAG,适合入门学习和快速验证,推荐大家尝试:

  • GitHub地址:https://github.com/HKUDS/LightRAG

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1129095.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Z-Image-Turbo用户权限管理:多账号体系的设计思路

Z-Image-Turbo用户权限管理:多账号体系的设计思路 引言:从单机工具到团队协作的演进需求 随着 Z-Image-Turbo WebUI 在内容创作、设计预研和AI艺术生成场景中的广泛应用,其使用模式正从“个人本地运行”逐步向“团队共享部署”转变。当前版…

收藏!后端转大模型应用开发:靠工程化优势站稳脚,保姆级学习路线图

后端转大模型应用开发,市场缺的从不是只会跑通Demo的算法实习生,而是咱们这类懂高并发、熟分布式、能把系统做得稳定、安全又可维护的工程化人才。想入局大模型开发,核心要掌握Python、Prompt Engineering、RAG、Fine-tuning及Agent这几项关键…

边缘设备也能做人像分割?M2FP轻量化CPU版本正式发布

边缘设备也能做人像分割?M2FP轻量化CPU版本正式发布 📖 项目简介:M2FP 多人人体解析服务(WebUI API) 在智能硬件、边缘计算和低功耗场景日益普及的今天,如何在无GPU支持的设备上实现高精度语义分割&#x…

私有云盘自建教程|使用服务器搭建开源云盘系统 Cloudreve

在 个人文件管理、团队协作、项目交付 的过程中,很多人都会慢慢意识到一个问题: 📁 文件越来越多,散落在各个平台 ☁️ 公共云盘容量贵、规则多、说限就限 🔒 隐私文件放在第三方平台,总有点不安心 📤 想给客户或朋友分享文件,却不够专业 直到我在服务器上部署了…

如何扩展M2FP功能?添加新颜色映射表自定义部位样式

如何扩展M2FP功能?添加新颜色映射表自定义部位样式 🧩 M2FP 多人人体解析服务简介 M2FP(Mask2Former-Parsing)是一项专注于多人人体语义分割的先进视觉技术,能够对图像中多个个体的身体部位进行像素级识别与分类。其核…

数据集增强新方法:用M2FP生成伪标签扩充训练样本

数据集增强新方法:用M2FP生成伪标签扩充训练样本 📌 背景与挑战:高质量标注数据的稀缺性 在计算机视觉任务中,尤其是语义分割、姿态估计和人体重识别等方向,像素级标注数据是模型训练的核心资源。然而,人工…

对比Mask2Former原版:M2FP针对人体任务专项优化

对比Mask2Former原版:M2FP针对人体任务专项优化 📌 从通用分割到人体解析:为何需要M2FP? 语义分割作为计算机视觉的核心任务之一,近年来随着Transformer架构的引入实现了显著突破。Mask2Former 作为该领域的代表性模…

AI图像生成工作坊:Z-Image-Turbo教学培训实施方案

AI图像生成工作坊:Z-Image-Turbo教学培训实施方案 引言:开启高效AI图像创作的新范式 在AIGC(人工智能生成内容)快速发展的今天,高质量、低延迟的图像生成能力已成为创意设计、数字营销、游戏开发等领域的核心需求。阿…

私有化文件实时同步方案|使用服务器搭建多设备文件同步工具 Syncthing

在 多设备办公 / 运维 / 开发 / 个人资料管理 的过程中,你一定遇到过下面这些真实问题: 💻 公司电脑、家里电脑、服务器文件来回拷 ☁️ 依赖网盘同步,但速度慢、限流、隐私堪忧 🔁 rsync 要手动执行,自动化体验差 🔒 文件一旦上传第三方,总觉得不够安心 直到我…

Z-Image-Turbo应用于社交媒体内容创作的工作流

Z-Image-Turbo应用于社交媒体内容创作的工作流 阿里通义Z-Image-Turbo WebUI图像快速生成模型 二次开发构建by科哥 在当今内容为王的社交媒体时代,高质量视觉素材已成为品牌传播、用户互动和流量转化的核心驱动力。然而,传统图像设计流程耗时长、成本高…

Z-Image-Turbo光影一致性增强方法论

Z-Image-Turbo光影一致性增强方法论 引言:从快速生成到视觉一致性的进阶需求 阿里通义Z-Image-Turbo WebUI图像快速生成模型,作为基于DiffSynth Studio框架二次开发的高性能AI图像生成工具,由开发者“科哥”深度优化后,在本地部…

收藏!2025 AI热点复盘+2026普通人AI学习指南,小白程序员必看

2025年已然翻篇,这一年里有人收获满满、珍藏无数喜悦瞬间,也有人带着未完成的遗憾奔赴2026。而在AI圈,2025年绝对是浓墨重彩的一年——技术突破不断、热门产品频出,彻底改变了AI在大众心中的模样。今天这篇文章,就来好…

在线资源全攻略:漏洞复现、CVE 追踪、实战提升一条龙

在线资源全攻略:漏洞复现、CVE 追踪、实战提升一条龙 在网络安全领域,“漏洞复现能力” 是衡量安全工程师水平的关键指标之一。无论是挖 SRC 漏洞、参加 CTF 比赛、做红蓝对抗,还是做企业安全运营,都离不开对最新漏洞的理解、复现…

Z-Image-Turbo依赖环境配置详解:conda+torch28环境搭建

Z-Image-Turbo依赖环境配置详解:condatorch28环境搭建 阿里通义Z-Image-Turbo WebUI图像快速生成模型 二次开发构建by科哥 运行截图 引言:为什么需要独立的 conda torch2.8 环境? 阿里通义推出的 Z-Image-Turbo 是一款基于扩散模型的高性…

耐达讯自动化赋能:Canopen转Profibus网关水泵连接新范式

在化工厂的反应釜控制区,工程师张工正对着PLC报警界面抓耳挠腮。新采购的Canopen智能水泵与车间原有的Profibus系统如同"油盐不进",数据传输时序偏差导致反应温度失控。这种协议兼容性问题在设备迭代周期中尤为突出——据统计,72%的…

mofos成人内容过滤:基于开源模型的合规解决方案

mofos成人内容过滤:基于开源模型的合规解决方案 引言:AI驱动下的内容安全挑战与破局之道 随着短视频、社交平台和UGC(用户生成内容)生态的爆发式增长,网络空间中的成人内容泛滥已成为平台运营者不可忽视的合规风险。尤…

Z-Image-Turbo中文提示词支持体验:描述越细效果越好?

Z-Image-Turbo中文提示词支持体验:描述越细效果越好? 引言:AI图像生成的“细节革命”正在发生 在AIGC(人工智能生成内容)快速演进的今天,图像生成模型已从“能画出来”迈向“画得精准”的新阶段。阿里通义…

【收藏学习】大模型应用架构之道:Multi-Agent系统设计模式详解

本文介绍了Multi-Agent系统(MAS)的8种基本设计模式,包括顺序流水线、协调器/调度器、并行分发/收集、层次分解、生成器与评论家、迭代优化、人机协同和复合模式。这些模式帮助构建专业化、模块化和可靠的AI系统,解决单一Agent"样样通,样…

MGeo与Flink实时计算结合:流式地址消重与聚合

MGeo与Flink实时计算结合:流式地址消重与聚合 引言:中文地址数据的挑战与MGeo的破局之道 在电商、物流、本地生活等业务场景中,用户提交的地址信息往往存在大量非标准化表达。例如,“北京市朝阳区建国路88号”和“北京朝阳建国路8…

游戏动捕成本太高?M2FP提供平价替代方案实现基础识别

游戏动捕成本太高?M2FP提供平价替代方案实现基础识别 🧩 M2FP 多人人体解析服务:低成本实现动作语义理解的新路径 在游戏开发、虚拟偶像、AR互动等场景中,动作捕捉技术一直是构建真实数字角色行为的核心环节。传统光学动捕系统动辄…