收藏级|后端研发视角:AI在保险业务的落地实践,RAG架构从基础到混合式演进全解析

作为一名深耕后端领域十余年的研发人员,我踏入AI赛道已有两年光景。从最初的Chat QA场景搭建,到AI Agent开发、Multi-Agent协同,再到AI-Native架构的深度探索,每一步都踩着大模型技术迭代的浪潮前行。

今年第二季度,我们团队正式将AI技术与保险核心业务深度绑定,开启全面落地征程。目前,自研的AI Agent已顺利跨越L1级Chatbot基础交互阶段,在L2级Reasoner逻辑推理层面实现能力爆发,能够处理保险条款解读、理赔核查等复杂业务场景。

谈及AI浪潮下的研发心态,焦虑是绕不开的话题。大模型技术的更新速度实在迅猛,尤其是Cursor、JoyCode等智能开发工具普及后,不仅后端研发,所有业务研发人员都面临转型压力——曾经内卷的微服务、微前端架构已不是风口核心,AI成为行业新的竞争焦点。这种焦虑并非后端专属,模型开发领域同样如此,单一Agent架构早已退出主流舞台。

而我对抗焦虑的核心解法,是将后端深耕多年的微服务架构思想迁移至AI领域:把Agent、Planning、RAG、Evaluation、MCP、LLM、Prompt、Memory、MultiModal等核心模块拆解为独立服务,通过标准化接口实现协同联动,构建可扩展、高可用的AI技术体系。

其中,RAG(检索增强生成)作为解决保险业务知识密集型需求的核心技术,我们的自研产品“保险Eva”已完成三轮架构迭代,从基础RAG逐步升级至DeepSearch增强版,最终落地融合Graph RAG、DeepSearch与持续反思验证机制的混合式检索架构,这也是本文要重点拆解的内容。

后端研发的 AI 突围

作为一名后端研发,开始AI之路已经2年,从Chat QA,到AI Agent的开发,在到Multi-Agent,AI-Native。

今年Q2开始结合保险业务场景,开始全面AI落地。我们的AI Agent的能力已跨过L1(Chatbot),在L2(Reasoner)全面爆发。

我内心是焦虑的,大模型发展的得太快,尤其是在Cursor、JoyCode等产品出来后。我想不止是后端研发,所有的业务研发都会焦虑,因为现在风口不在卷微服务、微前端的架构,全都开始卷AI了。 除了AI Infra外,模型开发也一样焦虑吧,单一的Agent也已是过去式。

我的解药是把微服务架构应用到AI上,什么Agent、Planning、RAG、Evaluation、MCP、LLM、Prompt、Memory、MultiModal都安排起来。

保险Eva的RAG架构经历了三个阶段,从基础RAG到Deepsearch,在到混合式检索架构(Graph RAG + DeepSearch**+**持续的反思与验证)

RAG架构

历史:

首先我们回顾下什么是RAG?RAG(Retrieval-Augmented Generation - 检索增强生成 )是一种构建基于大模型(LLM)应用的创新技术,通过利用外部知识源为LLM提供相关上下文,从而减少幻觉现象,提高生成内容的准确性和可靠性。最早要追溯到2020年,是由Facebook AI Research(Meta AI)提出的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》

基础 RAG 架构,朴素的知识管理员

基础 RAG 是所有RAG范式的基础,包括DeepResearch、Agentic RAG、Graph RAG都是在基础RAG上进化出来的。所以我们先熟悉下基础RAG的架构,它包含两个核心组件:生成组件(ETL Pipeline)和检索组件(Retrieval)引入下图为例:

①,②,③,④步骤都是生成组件,它的核心就是文件**提取、转换、加载,**我们来一步步分析。

•文件提取(Extract):核心文件读取器,常用的有doc、pdf、excel、图片等文件,需要关注对中文支持和Execl单元格的处理。

•文件转换(Transform):文件转换的核心有两个chunkembedding

chunk阶段尤为关键是所有RAG范式的核心,就像切蛋糕一样,切之前就已分配好**:**

常用的分块策略有五种:固定大小分块,语义分块、递归分块,基于文档结构分块,基于大模型分块。

embedding:向量化,向量是为了满足相似性查找的需求,比如表达“今天天气如何?”这类的询问方式有很多,这时我们需要将文本向量化,存入到向量库中

数据加载(Load)**:**数据存储,我们用的Elasticsearch8+(ES)进行混合存储,当然也可以其他向量库和关系型数据库来存储。

⑦,③,④,⑤,⑥步骤是检索组件,它分为预处理、检索、后处理

预处理核心是Query:要不要做Query的扩充?扩充多少?带不带原始Query?需不需要对Query转译?预处理偏向于业务处理,根据需求来,相当于基础RAG的一扩展特性,Agentic RAG范式沿用了这一特性。

检索的核心是算法:基础的检索算法“稀疏算法和稠密算法”

稀疏算法可以利用LLM提取关键词,embedding维度设为整个表中所有的关键词的维度,维度上的值是关键词在当前文本块中的TF-IDF值。当用户查询时,系统会将其转化为一个类似的TF-IDF向量,通过计算用户查询向量和所有文本块向量之间的cosine,找到得分最高或最相似的向量块。稠密算法常用的是BM25,用户输入查询时,系统会使用LLM将查询转化为一个embedding向量,然后在向量数据库中进行cosine计算,找到最相似的向量块。
  1. 第③步中用相同的嵌入文本块模型,向量化用户的查询

  1. 然后,将向量化的查询与数据库中现有的向量进行比较,以找到最相似的信息。常规的向量检索ANN算法,我们还支kNN算法,向量库的表结构的基础字段索引,向量块,原始文本块,原数据字段。

  1. TopK,通过预设的k阈值,我们只获取最相似的k条原始文本块返回,这是rank的流程。

后处理的核心是排序:在精排(Rerank)也就是二段检索,之后会进行文本拼接,把结果拼接到上下文中生成Prompt,最后由LLM生成最终答案(Generate)。

Rerank不是一个必选项,Rerank模型会结合查询对检索到的初始文本块列表进行评估,为每个文本块分配一个相关性分数。这一过程会重新排序。

最后一步是生成结果,将原始的查询和检索到的文本块,拼接到Prompt中,由大模型生成最终的结果。

倒退到2022年,基础的RAG方案是很OK的。随之模型发展到现在的Agentic Agent,需要解决的往往是对复杂问题的深度检索,基础的RAG这时显得非常的无力,但也促使RAG演进了新的范式:Graph RAG,Agentic RAG,DeepResearch

我们的RAG架构

我们的RAG产品架构上包含了“保险知识库+记忆库+文件库+智能体+搜索+测评”,是技术驱动由算法,工程,数据一起完成的。

算法AgenticRAG:我们学习了通义DeepResearch的开源WebWeaver架构,微软的开源GraphRAG,结合现在火热的ZEP、REFRAG的论文

架构上实现了混合式检索“Agentic RAG+DeepResearch”,记忆实现了“情景记忆+程序记忆+语义记忆+时间记忆”,RAG智能体矩阵实现了“RAG查询增强智能体,规划师智能体,工具选择器智能体,反思和验证智能体,基于图结构的智能体,深度研究型智能体”。

记忆设计:语义记忆图谱,程序记忆图谱,情景记忆图谱

工程RAG平台:承上启下串联全流程,承接业务Agent的检索、查询的需求,提供标准接口让Agent专注于模型训练迭代

工程架构分了四层:智能体层,业务逻辑层,检索层,数据层;技术栈:Spring AI ,Elasticsearch8+,Neo4j,Redis,京东云;技术能力支持上支持Python Code和RAG Agent Workflow。

数据架构:保险知识库+记忆库+任务中心 组成三角矩阵

保险知识库架构:

任务中心:

Chunck:学习Cognee参数调优的思想,提供了五种chunk策略。

记忆库:“语义记忆图谱,程序记忆图谱,情景记忆图谱”在此三类记忆上增加双时间字段,保证记忆的时效性。

为什么这样设计?

我们团队核心是一套由多智能体驱动业务的平台(Eva)

•我们是需要RAG是因为保险业务,保司的很多数据是网上没有的,并且内容很多,上百页甚至大几百页的文档比比皆是。

•我们是ToB业务,是围绕业务发展的Agent,直面经营结果(规模/利润)。

•我们的RAG平台隶属于Eva基础能力之一。

未来的RAG

不再过多揣测未来,乘风破浪即可。

•Agentic RAG里面包含了Deepsearch,Graph RAG,基础RAG,如果感兴趣我会像基础RAG一样,一层层剥开和大家交流

•Python Code和RAG Agent Workflow是工程端的自研核心,如果感兴趣我会像基础RAG一样,一层层剥开和大家交流

•记忆库除了“语义记忆图谱,程序记忆图谱,情景记忆图谱”我们还在研发时间记忆图谱,如果感兴趣我会像基础RAG一样,一层层剥开和大家交流

•Chunck绝对是核心,以至于让Cognee花了大半年时间在参数调优上,我们总结一份配置手册,如果感兴趣我会像基础RAG一样,一层层剥开和大家交流

最后

近期科技圈传来重磅消息:行业巨头英特尔宣布大规模裁员2万人,传统技术岗位持续萎缩的同时,另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式!据行业招聘数据显示,具备3-5年大模型相关经验的开发者,在大厂就能拿到50K×20薪的高薪待遇,薪资差距肉眼可见!

业内资深HR预判:不出1年,“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下,“温水煮青蛙”式的等待只会让自己逐渐被淘汰,与其被动应对,不如主动出击,抢先掌握AI大模型核心原理+落地应用技术+项目实操经验,借行业风口实现职业翻盘!

深知技术人入门大模型时容易走弯路,我特意整理了一套全网最全最细的大模型零基础学习礼包,涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费,免费分享给所有想入局AI大模型的朋友!

👇👇扫码免费领取全部内容👇👇

部分资料展示

1、 AI大模型学习路线图

2、 全套AI大模型应用开发视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

3、 大模型学习书籍&文档

4、AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、大模型大厂面试真题

整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题,涵盖基础理论、技术实操、项目经验等维度,每道题都配有详细解析和答题思路,帮你针对性提升面试竞争力。

6、大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

  • 👇👇扫码免费领取全部内容👇👇

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1168731.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

django-flask基于python篮球比赛CBA联赛管理系统pycharm -Vue

目录系统概述技术架构核心功能部署与扩展关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!系统概述 基于Python的CBA联赛管理系统整合Django与Flask框架,后端采用Django处…

BurpSuite 保姆级使用指南|纯干货分享

我的BurpSuite食用方法 | 干货 0x1 Burp安装与破解 访问官网直接下载Mac OS的安装版:https://portswigger.net/burp/releases,然后正常安装。 破解: git clone https://github.com/TrojanAZhen/BurpSuitePro-2.1.git在应用程序中找到burp,显示包内容…

#智慧景区#多场景管理系统,一体系,多场景,全赋能

一、项目背景 为推进传统景区向智慧化、数字化转型升级,本项目围绕管理效率与游客体验双重目标,构建智慧景区多场景管理系统。系统通过整合客流监测、AI安防、智慧停车、信息发布与舆情预警等功能,实现景区实时调度与安全管控;同时…

MMC-HVDC仿真模型:探究21电平NLM与均压控制下的双端及多端直流输电系统基础模型

MMC-HVDC仿真模型,pscad柔性直流输电仿真mmc仿真模型,双端mmc模型,MMC为21电平NLM和均压控制,还有多端如张北直流电网以及基本mmc逆变器,自己为毕业网上收集的一些觉得有用的基础模型最近在折腾MMC-HVDC仿真&#xff0…

django-flask基于python减肥健身养生人士饮食营养管理系统

目录摘要关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 随着健康生活方式的普及,减肥健身和养生人士对饮食营养管理的需求日益增长。基于Python的Django和Flask框…

单北斗GNSS技术在变形监测中的应用及其位移监测优势解析

本文主要围绕单北斗GNSS技术在变形监测中的应用进行探讨。单北斗GNSS技术以其高精度和实时性,使得在地质灾害监测和基础设施安全评估中发挥着重要作用。通过使用单北斗变形监测一体机,可以有效获取位移信息,从而为工程师提供及时的数据支持。…

氢气压缩机远程监控系统方案

在氢能储运、加氢站运营、化工制氢等关键领域,氢气压缩机是实现氢气增压、输送与储存的核心设备,其运行稳定性直接关系到供氢安全、系统效率与运营成本。随着氢能基础设施的规模化部署与智能化升级,传统氢气压缩机依赖现场值守、定期巡检与被…

三相电压型PWM整流器仿真分析与研究:关键技术及应用探索

三相电压型PWM整流器仿真资料三相电压型PWM整流器这玩意儿搞电力电子的应该都熟,今天咱们用Simulink搭个仿真模型实战下。直接从主电路开整——六个IGBT管子摆成桥臂,中间接个LC滤波器,电网侧串点电感模拟线路阻抗。别小看这个LC参数&#xf…

Qt集成Echarts百度地图应用开发综合源码:功能强大且高度可定制的地图封装类

Qt百度地图综合应用源码 ### (一)、Echarts地图封装类功能特点 1. 同时支持闪烁点图、迁徙图、区域地图、仪表盘等。 2. 可以设置标题、提示信息、背景颜色、文字颜色、线条颜色、区域颜色等各种颜色。 3. 可设置城市的名称、值、经纬度 集合。 4. 可设置…

【深度】2024-2025 AI 行业下半场:告别“参数竞赛”,卷向“落地”与“Agent”

如果说 2023 年是 AI 的“奇迹元年”,那么 2024 年到 2025 年则是 AI 的“价值回归年”。从最初被 ChatGPT 惊艳,到如今面对各种大模型层出不穷后的审美疲劳,开发者们最关心的问题已经从“模型参数有多大”变成了“这玩意儿能解决什么实际问题…

Linux ss命令比lsof命令快的原因剖析

主要区别 1. lsof(慢的原因) 遍历进程信息:lsof 需要遍历 /proc 文件系统下的所有进程目录,检查每个进程的文件描述符解析大量文件:需要读取 /proc/[pid]/fd/*、/proc/[pid]/maps 等文件获取详细信息:为了显…

在隐私合规时代 如何实现精准风控?

随着全球范围内对数据隐私保护的重视日益增强,iOS系统的ATT框架、安卓系统的动态权限管理以及GDPR等法规的实施,标志着移动互联网已进入严格的隐私合规时代。一个核心的矛盾随之凸显:如何在充分尊重和保护用户隐私、不违规收集敏感信息的前提…

《从局部到全局:协同推理负载分配的深度优化指南》

设备间协同推理的负载分配本质是异构能力、任务语义与传输特性的三维共振,其核心困境并非简单的算力匹配,而是在设备类型离散、任务阶段耦合、网络状态波动的复杂场景中,打破“局部最优”陷阱,实现全局效能的精准跃迁。最初接触这类问题时,很容易陷入“性能导向”的单一分…

近几年持证人薪资高20%的CAIE证书,这些坑千万别踩

AI技术加速渗透职场,CAIE注册人工智能工程师认证凭借对职业竞争力的提升作用,成为不少人转型进阶的选择。但伴随报考热度攀升,各类陷阱也层出不穷。本文结合官方规则,拆解核心避坑要点,帮大家合理规划备考路径&#xf…

网络安全知识图谱:从核心定义到技术全景,构建你的系统性认知与防范体系

伴随着互联网的发展,它已经成为我们生活中不可或缺的存在,无论是个人还是企业,都离不开互联网。正因为互联网得到了重视,网络安全问题也随之加剧,给我们的信息安全造成严重威胁,而想要有效规避这些风险&…

全网最全2026本科生AI论文写作软件TOP10:开题报告文献综述必备

全网最全2026本科生AI论文写作软件TOP10:开题报告文献综述必备 2026年本科生AI论文写作工具测评:为何需要这份榜单? 随着人工智能技术的不断进步,AI写作工具在学术领域的应用日益广泛。对于2026届的本科生而言,撰写开题…

VP引导定位软件-平移九点标定生产验证

VP引导定位软件-平移九点标定生产验证 一 生产TB 一 加载图像 private void materialButton19_Click(object sender, EventArgs e){OpenFileDialog openFileDialog new OpenFileDialog();if (openFileDialog.ShowDialog() DialogResult.OK){string filePath openFileDialog…

网络安全核心技术体系构建:从基础框架到关键演进的深度总结

1.网络安全的概念 网络安全的定义 ISO对网络安全的定义:网络系统的软件、硬件以及系统中存储和传输的数据受到保护,不因偶然的或者恶意的原因而遭到破坏、更改、泄露,网络系统连续可靠正常地运行,网络服务不中断。 网络安全的属…

Windows 系统入侵排查实战指南:一步步揪出恶意入侵痕迹

基于Windows系统下的入侵排查 Windows入侵排查 常见的应急响应事件分类: Web入侵:网页挂马、主页篡改、Webshell 系统入侵:病毒木马、勒索软件、远控后门 网络攻击:DDOS攻击、DNS劫持、ARP欺骗 针对常见的攻击事件&#xff0…

网络安全与黑客技术的终极限定:核心领域全解析与成为“白帽黑客”的专业路径

提及网络安全,很多人都是既熟悉又陌生,所谓的熟悉就是知道网络安全可以保障网络服务不中断。那么到底什么是网络安全?网络安全包括哪几个方面?通过下文为大家介绍一下。 一、什么是网络安全? 网络安全是指保护网络系统、硬件、软件以及其中的数据免…