RAG系统架构

以上是从原始数据到最终返回 Top-K 结果的完整流程的信息检索或 RAG(Retrieval-Augmented Generation)系统架构图。整个流程分为四个主要阶段:Extraction(提取)、Preprocessing(预处理)、Indexing(索引构建)、Retrieval(检索)


🔍 流程详解

1.Extraction(提取)

目标:将原始数据(如 PDF、Word、网页等)转化为结构化内容。

  • 包含模块:
    • Document Layout Recognition(文档布局识别)
      → 识别文本、标题、图片、表格等在页面上的位置和结构。
    • Table Structure Recognition(表格结构识别)
      → 将表格内容解析为行/列结构,便于后续处理。
    • 其他未列出的提取任务(用...表示)

✅ 输出:结构化的文档内容(例如:段落、标题、表格数据等),由Document Parsing Model完成。


2.Preprocessing(预处理)

目标:对提取出的内容进行语义增强与组织,提升后续索引和检索的质量。

  • 包含模块:
    • Knowledge Graph Construction(知识图谱构建)
      → 从文本中抽取实体、关系,构建图结构(如“人物-事件-地点”)。
    • Document Clustering(文档聚类)
      → 将相似内容的文档或段落分组,用于减少冗余或支持主题导航。
    • Embedding Models(嵌入模型)
      → 使用语言模型(如 BERT、Sentence-BERT)生成文本向量表示,为后续索引做准备。

✅ 输出:结构化+语义增强的数据,由Document Processing Model处理。


3.Indexing(索引构建)

目标:将预处理后的数据建立高效可检索的索引。

  • 包含模块:
    • Traditional Indices(传统索引)
      → 如倒排索引(Inverted Index),支持关键词快速查找。
    • Text Embedding(文本嵌入)
      → 将文本转换为稠密向量,用于语义相似度搜索。
    • Sparse Embedding(稀疏嵌入)
      → 如 BM25 的向量化形式,保留关键词权重,适合短文本匹配。
    • Subgraph Traversal(子图遍历)
      → 如果构建了知识图谱,则可通过图结构进行路径查询(如“谁参与了什么项目?”)。

✅ 输出:多种类型的索引结构,支持不同方式的检索。


4.Retrieval(检索)

目标:根据用户查询,从索引中召回最相关的 top-k 文档或片段。

  • 包含模块:
    • Tensor Based Fused Ranking(基于张量的融合排序)
      → 融合多个信号(如稠密向量 + 稀疏关键词 + 图结构)进行综合打分。
    • Other Fused Ranking(其他融合排序方法)
      → 可能包括多模态融合、重排序模型等。
    • Query Rewrite Models(查询改写模型)
      → 对原始查询进行扩展或优化(如添加同义词、补全意图),提升召回效果。

✅ 最终输出:Top K个最相关的结果。


🔄 整体流程总结

Data → [Extraction] → 结构化内容(布局、表格等) → [Preprocessing] → 语义增强(知识图谱、聚类、嵌入) → [Indexing] → 多类型索引(传统、嵌入、图结构) → [Retrieval] → 融合排序 + 查询改写 → Top K 结果

💡 核心思想

现代智能检索系统不再依赖单一方法,而是通过“多阶段、多模态、多策略”的协同工作,实现从原始数据到高质量结果的端到端处理。

它强调了以下几点:

关键点说明
结构感知提取阶段关注文档物理/逻辑结构(布局、表格),避免“纯文本切块”的问题。
语义增强预处理阶段引入知识图谱、聚类、嵌入,提升上下文理解能力。
多索引融合索引阶段同时支持传统关键词 + 语义向量 + 图结构,兼顾 recall 和 utilization。
智能检索检索阶段使用融合排序和查询改写,提升准确率和鲁棒性。

🎯 实际应用场景

这种架构常见于:

  • 长文档问答系统(如法律、医学文献)
  • 企业知识库(如内部文档、产品手册)
  • 大模型 RAG 系统(如 LlamaIndex、Weaviate、LangChain 等)

✅ 总结

这张图描绘了一个端到端的智能信息检索框架,通过结构化提取 → 语义预处理 → 多模态索引 → 融合检索的四步流程,解决“如何让机器既找得准、又用得好”的核心挑战。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1185697.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DiFi:当Wi-Fi遇上区块链,重新定义网络访问

在咖啡馆连Wi-Fi时,你可能遇到过类似情况:有人看视频卡顿,有人只是收封邮件却同样忍受低速——传统的网络访问常是“一刀切”的。DiFi尝试改变这一现状,它巧妙融合区块链技术和经济机制,旨在实现更智能、公平的网络资源…

【PR】音频调色

--本篇导航--音频处理画面调色自动匹配序列音频处理 拉长音频时长自动匹配多段音频的响度/音量 在【基本声音】面板中的响度,点击自动匹配,来统一音量。再给音频添加【强制限幅】效果,选择限幅-6dB音轨混合器音频音…

强烈安利9个AI论文平台,本科生搞定毕业论文不求人!

强烈安利9个AI论文平台,本科生搞定毕业论文不求人! AI 工具,让论文写作不再难 对于很多本科生来说,毕业论文是一个既熟悉又陌生的挑战。从选题到写作,再到查重和修改,每一步都可能让人感到压力山大。而如今…

从 ELF 视角理解 C/C++ 程序的内存布局:通用段、C++ 专属段与加载机制解析

目录标题1. 程序从磁盘到内存:ELF 与运行时加载的基本原理1.1 ELF 文件的双重视角:Section 与 Segment 的本质差异Section 的核心特征Segment 的核心特征1.2 从 execve 开始:内核如何加载一个 ELF 程序1.3 “加载”并不等于“拷贝”&#xff…

Turnitin系统计算重复率的方式!

英文论文查重一般使用的是Turnitin论文查重系统,今天给大家分享Turnitin系统计算重复率的方式! Turnitin系统主要是检测外文论文,所以重复率计算和中文查重系统(知网、维普和万方等)是不一样的。 中文论文的重复率&a…

【计算机毕业设计案例】基于python-CNN深度学习卷积神经网络对不同柑橘病变识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

事实核查领域的AI原生应用:现状、问题与突破

事实核查领域的AI原生应用:现状、问题与突破关键词:事实核查、AI原生应用、大语言模型、多模态验证、可信AI摘要:在信息爆炸的今天,虚假信息如“数字病毒”般快速传播,传统人工事实核查面临效率与覆盖的双重瓶颈。本文…

互联网大厂Java面试实战:Spring Boot与微服务在电商场景中的应用解析

互联网大厂Java面试实战:Spring Boot与微服务在电商场景中的应用解析 场景背景 谢飞机,一名求职于互联网大厂的Java程序员,今天参加了一场针对电商业务的Java开发面试。面试官严肃认真,围绕Java核心技术栈和电商业务场景进行提问&…

全网最全研究生必用AI论文网站TOP10:开题报告文献综述深度测评

全网最全研究生必用AI论文网站TOP10:开题报告文献综述深度测评 学术写作工具测评:为什么你需要一份靠谱的AI论文网站榜单 在当前学术研究日益依赖数字化工具的背景下,研究生群体对高效、专业的AI论文辅助平台需求愈发迫切。从开题报告到文献…

DevEco Studio:页面预览

在DevEco Studio中,可以预览页面。点击右侧工具条中的 眼睛 图标,可以预览。预览的页面需要用Entry修饰:点击后预览的效果:

STM32 单片机实战:基于 HAL 库的串口通信与中断处理详解

第一部分:串口通信基础与STM32硬件架构串口通信技术的历史演进与基本原理串行通信技术可追溯到19世纪的电信领域,经历了从机械电报到现代数字通信的漫长演进过程。在现代嵌入式系统中,通用异步收发传输器(UART)是实现串…

Windows安装Dokcer Desktop与汉化

文章目录1汉化版本2安装通过连接下载exe安装我不确定自己的电脑是什么样的?通过Windows PowerShell安装指定需要的版本结束语windows应该是大部分开发者使用率最高的系统,但这个系统无法部署一些项目,因此,通过下载Docker Desktop…

“星火行业分析师”获国家级认可,讯飞的大模型应用前景何在?

据同花顺财经的报道,近期,科大讯飞“星火行业分析师”连获两项重要认可:被国家工业信息安全发展研究中心认定为“垂直大模型典型应用案例”,并获评2025全球数字经济联盟(D50)峰会“数智应用领先成果”。这不…

2026专科生必备10个降AI率工具测评榜单

2026专科生必备10个降AI率工具测评榜单 2026专科生必备10个降AI率工具测评榜单 随着人工智能技术的不断发展,AIGC(人工智能生成内容)检测系统在学术领域中的应用愈发严格。对于专科生而言,论文、报告、作业等文本内容的AI率问题已…

当两个分布的0值具有特殊物理意义,怎么进行对齐 ?

通常,当数据的 0值具有特殊物理意义(例如:0表示无反应,正负表示相反的效果)时,我们不能简单地进行全局缩放,因为那可能会导致0点漂移。 需要以 0 为锚点,分别拉伸:负半轴部分:将蛋白质的负值最小值(Lower B…

垃圾有机质燃烧的热值

今天看到一则有意思的新闻,深圳准备开挖一个停用了20多年的生活垃圾填埋区,通过机械将挖出的垃圾进行分类处理,最终得到腐殖土、轻质物以及无机骨料这三种物质,其中腐殖土外运进行无害化处理,无机骨料进行资源化利…

python: 安装python 依赖pip install xxx报错,pip 不是内部或外部命令,也不是可运行的程序

python: 安装python 依赖pip install xxx报错,pip 不是内部或外部命令,也不是可运行的程序查看python版本:python --version 安装pip(查询ai发现 Python 3.4 及以上的版本,应该预装了pip )python -m pip install…

深度学习毕设选题推荐:基于python-CNN卷积神经网络机器学习对不同柑橘病变识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

近视防控:一场需要耐心与坚持的“持久战”!

‍  青少年近视率居高不下的现状,让“近视防控”成为每个家庭都绕不开的重要课题。不同于感冒发烧的“对症治疗”,近视防控既没有一蹴而就的特效药,也没有一劳永逸的解决办法,它更像是一场漫长的马拉松,考验着家长与…

产线上,逐个产品高速数据记录的一个方法

一、前言在离散制造的过程中,生产是间歇的,只需针对产品记录重要生产数据,既产品开始加工时,开始记录,加工完成后停止记录,并进行归档。并不需要像流程行业那样24小时不停地记录数据。比如:在钢管生产中,有一个…