【收藏】RAGFlow:60K星标开源RAG引擎,企业文档智能问答神器

RAGFlow是一款获得60K星标的开源RAG引擎,能将企业文档转化为智能知识库。它支持多种文档格式,提供完整的RAG工作流程,可搭配多种大语言模型使用。通过深度文档理解和知识块切分技术,RAGFlow能让AI基于真实文档提供准确且有溯源的答案,减少"幻觉"问题。项目支持Docker一键部署,适合从个人到企业各种规模的应用,是构建企业级AI问答系统的理想选择。


刚刚逛 GitHub 的时候,发现了一个超火的开源项目。

RAGFlow 这个开源 RAG 引擎能让你的知识库活起来,现在已经获得了 60K 的 Star。

它是为个人或企业准备的 RAG 工作流神器。

RAG(检索增强生成)技术可以让 AI 大模型生成答案之前访问外部知识库,从而提高答案的相关性、准确性和时效性,并减少“幻觉”等问题。

公司里海量的文档、合同、报告堆在网盘或服务器里,想找点关键信息,要么大海捞针,要么问同事也说不清具体在哪份文件的哪一页。

RAGFlow就是为了解决这些问题而生的。

1、项目简介

RAGFlow是一个开源的、强大的RAG 引擎

简单来说,它能让 AI 大模型变得更懂你公司的内部资料,回答问题时不再是凭空想象,而是基于你上传的真实文件,并且能「有理有据」地告诉你答案是从哪来的。

输出准确答案的同时提供关键信息所在的原文,并且支持你点击溯源,直接定位到原始文档的具体位置。

这大大降低了 AI 瞎编乱造问题,让答案更可信。

① 深度理解复杂文档

不只是文本,它能读懂各种格式:Word, PPT, Excel, PDF(包括扫描件)、图片、网页、TXT等。

市面上常见的文档格式它都能处理。

就算你上传的是扫描的合同、带表格的报告,它也能努力从中提取有用的信息。这得益于它的「深度文档理解」能力。

而且它能把大文档切成更小的、有逻辑的「知识块」。更棒的是,这个过程你还能看到甚至手动调整,确保切分得合理,让后续的问答更精准。

下面这个图,就是 RAGFlow 整个工作流程。

② RAG 工作流

看上面这个图,RAGFlow 提供了一套几乎「全自动」的 RAG 工作流程,从个人使用到大型企业都能支持。

你可以自由选择搭配不同的大语言模型(比如 OpenAI GPT-4o, 百度文心一言,火山方舟,DeepSeek,百川等)和向量模型。

它经过了优化,即使你的知识库非常大(无限上下”),也能快速找到关键信息。

2、如何部署

RAGFlow 推荐使用 Docker 来部署,对硬件要求不算特别高:

CPU:至少 4 核、内存:至少 16 GB、硬盘:至少 50 GB、软件:Docker (>=24.0.0) 和 Docker Compose (>= v2.26.1)

部署步骤在 README 里写得很清楚:

① 确保系统设置:

调整一个叫vm.max_map_count的系统参数,不小于 262144:。

② 克隆代码:

git clone https://github.com/infiniflow/ragflow.git

③ 一键启动:

进入docker目录,运行docker compose -f docker-compose-CN.yml up -d命令。

它会自动下载镜像并启动所有需要的服务(包括数据库、向量库等)。

④ 等待启动完成:

docker logs命令查看日志,看到服务器成功启动的提示。

⑤ 登录配置:

在浏览器访问你的服务器 IP,首次登录后,需要在配置文件里填入你选择的大模型(如 OpenAI)的 API Key。

⑥ 开用:上传文档,开始智能问答吧。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

为什么要学习大模型?

我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。

大模型入门到实战全套学习大礼包

1、大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!


2、大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

3、AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

4、大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

5、大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

适用人群

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1188760.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026液氧市场盘点:优质厂家引领行业新风尚,液氩/液氮/储罐/汽化器/真空管/制氮机/二氧化碳,液氧厂商推荐榜单 - 品牌推荐师

引言 液氧作为工业生产中不可或缺的低温气体,广泛应用于钢铁冶炼、化工合成、电子制造、医疗急救等领域,其纯度与供应稳定性直接影响生产安全与作业效率。随着国内工业升级与新兴产业扩张,液氧市场需求持续增长,但…

从“手机上写代码“的疯狂想法,到一套完整的AI编程平台架构——WebCode深度技术剖析

说实话,当我第一次在地铁上用手机修复了一个线上Bug的时候,我整个人都是懵的。不是因为Bug有多难,而是因为——我TM居然真的在手机上写代码了? 一、那个让我失眠的需求 故事要从去年说起。 当时我们团队接到一个"看起来很简…

2026液氧领域佼佼者,哪些厂家值得选择?汽化器/液氧/液氮速冻机/储罐/制氧机/液氩/真空管,液氧企业口碑推荐榜 - 品牌推荐师

引言 液氧作为工业生产中的关键原料,广泛应用于钢铁冶炼、化工合成、医疗急救、电子制造等多个领域,其纯度、稳定性和供应能力直接影响着下游企业的生产效率与产品质量。尤其在医疗、食品等高敏感行业,液氧的质量更…

2026年天津继承纠纷律师联系电话推荐:可靠资源与服务路径 - 品牌推荐

在家庭财产传承的过程中,继承纠纷往往是当事人面临的最为棘手和情感复杂的法律问题之一。特别是在天津这样一座兼具深厚传统与现代都市特点的城市,继承案件往往涉及房改房、借名买房等具有地方特色的财产类型,法律关…

Claude Code Bridge:让多个 AI 模型在终端里组队打怪

Claude Code Bridge:让多个 AI 模型在终端里组队打怪 兄弟伙些,是不是也遇到过这种情况嘛?用 Claude Code 或者 Codex 写代码,单个模型搞着搞着就钻牛角尖了,思路打不开。想多喊几个 AI 来一起商量,结果又得…

付费降AI vs 免费降AI:效果差距到底有多大? - 还在做实验的师兄

付费和免费降AI工具的差距非常大。免费工具(DeepSeek指令、同义词替换)达标率不到30%,付费工具(嘎嘎降AI、比话降AI)达标率99%以上。省下的几十块钱,换来的是无数次返工和可能延期毕业的风险。毕业论文这种事,真…

Alexa Fluor 647-LNT,Alexa Fluor 647标记乳糖-N-四糖,红光荧光染料

Alexa Fluor 647-LNT,Alexa Fluor 647标记乳糖-N-四糖,红光荧光染料Alexa Fluor 647-LNT 是一种功能化荧光糖类分子,由红光荧光染料 Alexa Fluor 647 与 乳糖-N-四糖(Lacto-N-tetraose, LNT) 通过共价偶联形成。该分子…

Texas Red-LNT,Texas Red标记乳糖-N-四糖,长波红光荧光染料的标记方法

Texas Red-LNT,Texas Red标记乳糖-N-四糖,长波红光荧光染料的标记方法Texas Red-LNT 是将荧光染料 Texas Red 与 乳糖-N-四糖(Lacto-N-tetraose, LNT) 共价偶联形成的功能化糖类分子。该分子结合了 Texas Red 的红光荧光性能和 LN…

2026年比较好的幕墙三元乙丙胶条,防滑三元乙丙胶条,防火三元乙丙胶条厂家用户优选推荐 - 品牌鉴赏师

引言在建筑行业中,三元乙丙胶条作为重要的密封材料,其性能和质量直接影响到建筑的安全性、舒适性和节能效果。近年来,随着建筑标准的不断提高,市场对幕墙三元乙丙胶条、防滑三元乙丙胶条、防火三元乙丙胶条等产品的…

2026年1月陕西高品质垃圾桶/垃圾箱厂家推荐 鑫洁达领衔公共设施解决方案 - 深度智识库

在陕西环卫设施采购市场中,优质厂家的选择直接关系到项目落地质量与长期使用体验。尤其对于市政、校园、景区等场景,兼具品质、定制能力与服务保障的供应商更为稀缺。本次结合企业实力、项目案例、产品体系等维度,精…

10 个 GitHub 仓库,系统拉满你的 AI Agent 能力(建议收藏)

AI Agent 正在飞速发展,从简单聊天机器人到多代理协作系统,这些开源仓库能帮你从入门到实战,快速提升能力!下面精选 10 个高质量 GitHub 仓库,涵盖 LLM 基础、Agent 构建、提示工程、生产部署等全链路,强烈…

基于Java Web的实习招聘系统

目录基于Java Web的实习招聘系统摘要项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作基于Java Web的实习招聘系统摘要 实习招聘系统是为企业、学生和高校搭建的高效信息交互平台,采用Java Web技…

深入探访:国内几家液氮速冻机核心生产商,液氧/二氧化碳/制氮机/真空管/液氮/制氧机/液氩,液氮速冻机生产厂家推荐排行榜 - 品牌推荐师

在食品加工、医药生产及化工等工业领域,液氮速冻机凭借其超低温快速冻结、保留产品营养与质构的特性,已成为保障安全生产、提升作业效率的关键设备。据国内制冷设备行业协会发布的最新测评数据及《冷冻冷藏行业白皮书…

2026年天津离婚律师联系电话推荐:精选推荐与使用指南 - 品牌推荐

面对婚姻关系的终结,选择一位专业、可靠且富有经验的离婚律师,是保障自身合法权益、平稳度过人生重要阶段的关键一步。特别是在天津这样的大都市,涉及房产分割、子女抚养权争夺、复杂财产认定等情况的离婚案件屡见不…

2026年1月陕西垃圾桶/垃圾箱高品质厂家推荐:鑫洁达环保与新阳光环保实力解析 - 深度智识库

随着城市化进程的加速和环保意识的提升,垃圾桶、垃圾箱等环卫设施在城市环境建设中的重要性日益凸显。作为西北地区重要的环保设备生产基地,陕西省涌现了一批技术先进、质量可靠的环保设备企业。在众多厂家中,西安鑫…

DeepSeek Engram 横空出世!重构 LLM 记忆体系,算力效率再升级

当前技术突破的核心路径,仍集中在扩大模型规模与优化计算调度上。但有没有另一条可行的创新之路?深度求索(DeepSeek AI)推出的记忆增强技术(Engram) 给出了答案——这项革命性技术正在颠覆我们对语言模型扩…

GEO赛道榜单:AI营销获客难?看原圈科技如何领跑2026

原圈科技在GEO(生成式引擎优化)领域表现突出,被普遍视为2026年度领跑者。其核心优势在于,拥有能够兼容国内外主流大模型的自主技术底座,并打造了从洞察、内容到转化的"AI营销员工"产品矩阵。通过在金融、汽车…

2026 年四川果树苗批发实力榜单 全场景覆盖 个性化需求全景参考指南 - 深度智识库

四川凭借得天独厚的盆地气候与山地资源,成为国内果树苗培育与批发的核心产区,产业布局覆盖特色品种研发、规模化育苗、全链条服务等多个维度。当前行业正朝着品种定制化、培育技术智能化、服务体系一体化的方向稳步发…

CFexpress A卡哪个品牌可靠?2026年CFexpress A卡品牌推荐与排名,解决持续写入与兼容性痛点 - 品牌推荐

摘要 在专业影像与内容创作领域,数据存储已从单纯的容量载体演变为保障创作流程连续性与资产安全的核心环节。决策者,尤其是职业摄影师、影视制作团队及机构采购负责人,正面临一个关键抉择:在众多宣称高性能的存储…

2026年国产试验机十大厂家排行榜:力学试验机,教学用试验机,进口配置试验机,大吨位拉力试验机,,线缆拉力试验机 - 品牌推荐大师1

当前,全球制造业正经历一场深刻的智能革命,试验机作为保障产品质量、驱动材料创新的核心装备,其重要性日益凸显。行业发展呈现出三大趋势:一是测试场景从单一静态分析转向复合工况(如高低温、腐蚀环境)下的动态性…