Milvus x DeepSeek 搭建低成本高精度 RAG 实战

为什么手握海量数据,却用不出真正的“智能”?要么 AI 模型学艺不精,答非所问;要么技术门槛太高,让普通开发者望而却步。现在,使用阿里云 Milvus 向量检索服务、DeepSeek 大模型和 PAI LangStudio 开发工具,只需像搭积木一样,将其进行简易拼接,就能轻松搭建一套‘能查会想’的 RAG 系统。接下来将基于阿里云的人工智能平台 PAI LangStudio,结合阿里云向量检索Milvus版的强大能力,并以 DeepSeek-R1-Distill 模型为例,为您详细介绍大模型 RAG 检索增强解决方案。当然如您需要更高配置的 DeepSeek R1 模型来满足使用需求,也可以复用以下技术链路来进行实现。

阿里云 Milvus+DeepSeek + PAI LangStudio 搭建智能问答助手,支持私域知识库和联网功能

Step 1: 创建阿里云 Milvus 实例的实例

可根据指引完成创建:快速创建Milvus实例_向量检索服务 Milvus 版(Milvus)-阿里云帮助中心

请注意,Milvus 实例和后续通过 PAI LangStudio 创建的 Embedding 服务、LLM 服务须在相同地域内。

Step 2 : 将 RAG 知识库上传至 OSS 中

本文针对金融、医疗场景提供以下示例语料:

  • 金融新闻:数据为 PDF 格式,主要内容为公开新闻网站上的新闻报道。

  • 疾病介绍:数据为 CSV 格式,主要内容为维基百科上的疾病介绍。

Step 3 :部署 DeepSeek 模型和 Embedding 模型

1. 前往 PAI 控制台的快速开始 > ModelGallery,分别按场景选择大语言模型及 **Embedding **分类,并部署指定的模型。本文以 **DeepSeek-R1-Distill-Qwen-7B **和 bge-m3 通用向量模型为例进行部署。(链接:https://pai.console.aliyun.com/#/quick-start/models)

如果您想完整体验 DeepSeek 模型,请选择 DeepSeek-R1 或 DeepSeek-V3。

2. 前往任务管理,单击已部署的服务名称,在服务详情页签下单击查看调用信息,分别获取前面部署的 DeepSeek 大预言模型和 Embedding 模型服务的 VPC 访问地址和 Token,供后续创建连接时使用。(链接:阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台)

Step 4 : 创建连接

4.1 创建 LLM 服务连接

  1. 进入 LangStudio,选择工作空间后,在连接管理页签下单击新建连接。(链接:阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台)

  2. 创建通用 LLM 模型服务连接。单击EAS 服务,从弹出的抽屉中选择已部署的服务,会自动填充base_urlapi_key

4.2. 创建 Embedding 模型服务连接

同创建 LLM 服务连接,创建通用 Embedding 模型服务连接。其中 **base_url **和 **api_key **分别对应部署 DeepSeek 大语言模型和 Embedding 模型中 Embedding 模型的 VPC 访问地址和 Token。

4.3 创建向量数据库连接

同创建 LLM 服务连接,创建 Milvus 数据库连接。

关键参数说明:

  • uri:Milvus 实例的访问地址,格式为http://<Milvus内访问地址>

您可以在阿里云Milvus控制台的 Milvus 实例的实例详情页面查看。例如,http://c-b1c5222fba****-internal.milvus.aliyuncs.com

  • token:登录 Milvus 实例的用户名和密码,填写格式为<yourUsername>:<yourPassword>

  • database:数据库名称,本文使用默认数据库default

Step 5.:创建离线知识库

新建知识库索引,将语料经过解析、分块、向量化后存储到向量数据库,从而构建知识库。新建知识库索引详细配置请参见:https://help.aliyun.com/zh/pai/user-guide/knowledge-base-index-management。

Step 6: 创建并运行RAG应用流

  1. 进入 LangStudio,选择工作空间后,在应用流页签下单击新建应用流,模板类型选择 RAG,创建 RAG 应用流。

2. 启动运行时:单击右上角启动运行时并进行配置。注意:在进行 Python 节点解析或查看更多工具时,需要保证运行时已启动。

注意专有网络配置:选择创建 Milvus 实例时的专有网络。

3. 开发应用流。应用流中的其余配置保持默认或根据实际需求进行配置,关键节点配置如下:

  • index_lookup:在知识库中检索与用户问题相关的文本。
    • registered_index:配置为已创建的知识库索引。
    • query:用户问题。

    • top_k:返回 top_k 条匹配的数据。

  • generate_answer:使用过滤后的文档作为上下文,与用户问题一起发送给大语言模型,生成回答。

    • connection:选择创建 LLM 服务连接中创建的连接。

    • model:输入 default。connection也可选择的是百炼大模型服务连接。

    • max_tokens:设置最大 token 数,本例设置为1000。

4. 调试/运行:单击右上角对话, 开始执行应用流。

5. 查看链路:单击生成答案下的查看链路,查看 Trace 详情或拓扑视图。

Step 7: 部署应用流

在应用流开发页面,单击右上角部署,部署参数其余配置保持默认或根据实际需求进行配置,关键参数配置如下:

  • 资源部署信息 > 实例数:配置服务实例数。本文部署仅供测试使用,因此实例数配置为1。在生产阶段,建议配置多个服务实例,以降低单点故障的风险。

  • 专有网络配置 > VPC:配置 Milvus 实例所在的专有网络。

更多部署详情,请参见https://help.aliyun.com/zh/pai/user-guide/application-flow-deployment。

Step 8: 调用服务,进行对话

部署成功后,跳转到 PAI-EAS,在在线调试页签下配置并发送请求。请求参数中的 Key 与应用流中输入节点中的"Chat 输入"字段一致,本文使用默认字段question。输入以下内容。

{"question":"请根据最新的新闻报道,分析美国科技行业目前投资分管性如何,是否存在泡沫,给出是或否的具体回答"
}

更多调用方式(如API调用)及详细说明,请参见将应用流部署为EAS服务_人工智能平台 PAI(PAI)-阿里云帮助中心。

开启联网搜索

如果您希望使用 DeepSeek-R1模型,快速构建具备联网搜索与 RAG(检索增强生成)功能的智能应用流,可以参见 Chatbot with RAG and Web Search。(链接:Chatbot with RAG and Web Search_人工智能平台 PAI(PAI)-阿里云帮助中心)

立即体验

我们诚邀您立即体验阿里云向量检索服务 Milvus 版的强大功能!您只需登录阿里云账号,进入向量检索服务 Milvus 版产品控制台(阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台 ),即可创建阿里云 Milvus 实例,开箱即用。

此外,为回馈新老用户,阿里云 Milvus 推出了重大优惠:

向量检索服务 Milvus 版产品全部规格,年付通通5折!

阿里云向量检索服务 Milvus 版,将持续打磨产品,不断优化产品的功能、性能和使用体验,为用户提供更加专业、灵活、高效的向量搜索引擎服务,助力企业轻松应对海量非结构化数据管理挑战,实现业务价值最大化,欢迎大家体验!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/70779.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

每日一题——两数之和

两数之和 问题描述示例提示思路分析代码实现代码解析1. 哈希表结构体定义2. 初始化哈希表3. 释放哈希表内存4. 主函数 twoSum5. 返回结果复杂度分析 第二种解法代码功能概述代码详细注释1. 哈希表结构体定义2. 哈希表指针3. 查找函数4. 插入函数5. 两数之和函数 6. 主函数&…

2025年SCI1区TOP:真菌生长优化算法FGO,深度解析+性能实测

目录 1.摘要2.算法原理3.结果展示4.参考文献5.代码获取 1.摘要 本文提出了一种新型的自然启发元启发式算法——真菌生长优化算法&#xff08;FGO&#xff09;&#xff0c;灵感来源于真菌在自然界中的生长行为。真菌的生长行为包括菌丝生长、分枝和孢子萌发&#xff0c;菌丝生长…

穿越AI边界:深度集成DeepSeek API与云平台的实践之路

云边有个稻草人-CSDN博客 随着人工智能技术的日益发展&#xff0c;深度学习和自然语言处理&#xff08;NLP&#xff09;已经在很多领域得到了广泛的应用。DeepSeek作为一款领先的大型语言生成模型&#xff0c;凭借其强大的推理和生成能力&#xff0c;已经被越来越多的开发者和…

动态表头导出EasyExcel

在 Spring Boot 中结合 EasyExcel 实现动态表头导出&#xff08;无实体类&#xff0c;表头和字段&#xff08;前端传表名&#xff0c;字段值动态查询&#xff0c;返回List<Map<String,Object>>&#xff09;由前端传递&#xff09;可以通过以下步骤实现。以下是完整…

1 | 从零开始解密数据库:数据库基础概念

❤个人主页&#xff1a;折枝寄北的博客 ❤专栏位置&#xff1a;数据库专栏 目录 前言1. 数据&#xff08;data&#xff09;2. 数据库(DB)3. 数据库管理系统(DBMS)4. 数据库系统(DBS) 感谢您的阅读支持 前言 【前言】 在万物互联的数字时代&#xff0c;数据已成为驱动社会运转…

Web自动化之Selenium下Chrome与Edge的Webdriver常用Options参数

目录 引言 说明 Add_argument() 添加方式 常用参数 Add_experimental_option() 添加方式 常用方法 任务结束后仍然保持浏览器打开 禁用“Chrome 正受到自动测试软件的控制”提示 设置下载路径 禁用弹窗拦截 禁用图片加载 禁用 JavaScript 注意 引言 …

AI提示词的种类与适合的任务

以下是提示词的主要种类及其适用任务&#xff0c;基于大模型特性与最佳实践总结&#xff1a; 一、基础提示词 零样本提示&#xff08;Zero-shot Prompting&#xff09; 形式&#xff1a;直接输入任务指令&#xff0c;不提供示例&#xff08;如“翻译以下句子&#xff1a;Hello …

FTP 实验(ENSP模拟器实现)

目录 FTP 概述 FTP实验 FTP的报文交互 FTP 概述 FTP&#xff08;File Transfer Protocol&#xff0c;文件传输协议&#xff09;是一种用于在网络上进行文件传输的标准协议。它允许用户在两台计算机之间上传和下载文件。 1、FTP采用客户端-服务器模型&#xff0c;客户端通过…

Windows前端开发IDE选型全攻略

Windows前端开发IDE选型全攻略 一、核心IDE对比矩阵 工具名称最新版本核心优势适用场景推荐指数引用来源VS Code2.3.5轻量级/海量插件/跨平台/Git深度集成全栈开发/中小型项目⭐⭐⭐⭐⭐14WebStorm2025.1智能提示/框架深度支持/企业级调试工具大型项目/专业前端团队⭐⭐⭐⭐47…

鸿蒙5.0实战案例:har和hsp的转换

往期推文全新看点&#xff08;文中附带全新鸿蒙5.0全栈学习笔录&#xff09; ✏️ 鸿蒙&#xff08;HarmonyOS&#xff09;北向开发知识点记录~ ✏️ 鸿蒙&#xff08;OpenHarmony&#xff09;南向开发保姆级知识点汇总~ ✏️ 鸿蒙应用开发与鸿蒙系统开发哪个更有前景&#…

简单易懂,解析Go语言中的struct结构体

目录 4. struct 结构体4.1 初始化4.2 内嵌字段4.3 可见性4.4 方法与函数4.4.1 区别4.4.2 闭包 4.5 Tag 字段标签4.5.1定义4.5.2 Tag规范4.5.3 Tag意义 4. struct 结构体 go的结构体类似于其他语言中的class&#xff0c;主要区别就是go的结构体没有继承这一概念&#xff0c;但可…

记录一下用docker克隆某授权制定ip的环境恢复

#首先还是要看日志根据问题去进行调整 java web的老项目配置文件一般是 bin启动里边的脚本 还有conf中的 xml配置文件 再或者就是classes中的配置文件,再或者就是lib中的jar包中的配置文件 1.安装docker 2.创建docker网络 docker network create --driver bridge --subnet…

SAP-ABAP:使用ST05(SQL Trace)追踪结构字段来源的步骤

ST05 是 SAP 提供的 SQL 跟踪工具&#xff0c;可以记录程序运行期间所有数据库操作&#xff08;如 SELECT、UPDATE、INSERT&#xff09;。通过分析跟踪结果&#xff0c;可以精准定位程序中结构字段对应的数据库表。 步骤1&#xff1a;激活ST05跟踪 事务码 ST05 → 点击 Activa…

【落羽的落羽 数据结构篇】树、二叉树

文章目录 一、树1. 树的概念和结构2. 树的相关术语 二、二叉树1. 概念与结构2. 满二叉树3. 完全二叉树4. 二叉树的性质5. 二叉树的存储结构 一、树 1. 树的概念和结构 之前我们学习了线性表&#xff0c;今天我们再来接触一种全新的数据结构——树。 树是一种非线性的数据结构…

blender bpy渲染禁用日志

效果有待测试&#xff1a; import bpyimport logging # 设置日志级别为ERROR&#xff0c;只有错误信息才会输出 logging.getLogger().setLevel(logging.ERROR) 这段代码会将日志级别设置为ERROR&#xff0c;只会显示错误信息&#xff0c;其他的日志&#xff08;如调试信息、…

CPU、MCU、MPU、SOC、DSP、ECU、GPU、FPGA傻傻分不清楚?一文讲清它们的区别

文章目录 前言一、定义与功能1、CPU&#xff08;Central Processing Unit&#xff0c;中央处理器&#xff09;2、MCU&#xff08;Microcontroller Unit&#xff0c;微控制单元&#xff09;3、MPU&#xff08;Microprocessor Unit&#xff0c;微处理器&#xff09;4、SOC&#x…

前端包管理工具进化论:npm vs yarn vs pnpm 深度对比

前端包管理工具进化论&#xff1a;npm vs yarn vs pnpm 深度对比 一、工具定位与核心差异二、功能特性对比三、优缺点深度解析四、性能实测对比&#xff08;示例数据&#xff09;五、选型建议六、未来趋势 一、工具定位与核心差异 npm (Node Package Manager) Node.js 官方捆绑…

网络安全学习-常见安全漏洞检测以及修复方法-1

渗*透测试 渗透测试就是模拟攻击者入侵系统&#xff0c;对系统进行一步步渗透&#xff0c;发现系统的脆弱环节和隐藏风险。形成测试报告提供给系统的所有者&#xff0c;所有者根据报告对系统进行加固&#xff0c;提升系统的安全性&#xff0c;防止真正的攻击者入侵。 渗透测试…

JVM之JVM的组成

Java 虚拟机&#xff08;JVM&#xff09;是 Java 程序的运行核心&#xff0c;它主要由类加载系统、运行时数据区、执行引擎和本地方法接口这几个关键部分组成。 类加载系统&#xff08;Class Loading System&#xff09; 类加载系统负责在程序运行时动态地将 Java 类加载到 J…

个人简历html网页模板,科技感炫酷html简历模板

炫酷动效登录页 引言 在网页设计中,按钮是用户交互的重要元素之一。这样一款黑色个人简历html网页模板,科技感炫酷html简历模板,设计效果类似科技看板图,可帮您展示技能、任职经历、作品等,喜欢这种风格的小伙伴不要犹豫哦。该素材呈现了数据符号排版显示出人形的动画效…