大模型实践(四):如何在Dify上利用工作流快速构建出一个基于用户意图识别以及RAG知识库检索增强的智能聊天机器人?

一、预备知识介绍

通过本篇文章,你将学习到:如何在Dify上利用工作流来快速构建一个可针对用户问题进行分类或者说意图识别,并能够根据分类结果自动选择检索相应的知识库后,结合大语言模型LLM进行回复的智能聊天机器人。

该实践中需要用到的功能组件和节点:

  1. 工作流

根据我们搭建的场景,这里需要使用到Chatflow工作流,它主要应用于面向对话类情景,包括客户服务、语义搜索、以及其他需要在构建响应时进行多步逻辑的对话式应用程序。

常见的交互路径:给出指令 → 生成内容 → 就内容进行多次讨论 → 重新生成结果 → 结束

  1. 节点

节点是工作流中的关键构成,通过连接不同功能的节点,执行工作流的一系列操作。Dify的工作流主要有以下15类核心节点,本次实践主要应用到了其中6类节点,具体如下图红框框所示。

若要了解每类节点的具体使用说明,请参考Dify官方文档:https://docs.dify.ai/zh-hans/guides/workflow/node。

2.1 知识库

在本工作流节点中,关于【知识库】节点的使用,我们分别尝试了以2种不同的数据来源方式构建了2个知识库,关于知识库的具体操作可参考上一篇文章。

  • 导入已有文本

  • 同步自Web站点

说明:这里我们采用的是通过【🔥 Firecrawl】工具进行网站内容的爬取,若你还没有申请免费的API,需要先申请API后,再使用。

爬取后的网页数据:

2.2 大语言模型

大语言模型是聊天工作流中非常重要的一类节点啦,在这里因为我们考虑了需要先对用户的问题分类,然后再基于分类结果分别选择不同的知识库检索后结合大语言模型进行回复,根据任务目标,这里就需要使用到3类大模型,以更好的完成以下3个任务:

  • 问题分类/意图识别

    为了更好的对用户的问题进行分类,这里我们选择了千问2.5-720亿参数的大模型。

  • 知识库检索

    这里需要使用到重排序模型,以期从知识库中检索到和问题更相关的内容,我们选择的是通义千问的gte-reank重排序模型。

  • 问题回复

    经过知识库检索后的结果,需要送入大语言模型进行最终的回复,这里的大语言模型我们选择的是通过Xinference本地化部署的通义千问2.5-instruct语言模型。

2.3 变量聚合

由于流程设计的逻辑是,首先基于用户问题分类,然后根据具体问题分别检索不同的知识库后再给到大模型进行回复,使用该节点可以将不同知识库检索的结果汇聚在一个节点,然后在该节点之后只需要连接一个大语言模型节点即可,若不使用该【变量聚合】节点,则需要在每个知识库后面都增加一个大语言模型节点。


二、实操演示

首先,搭建完成后的整个Chatflow流程如下图所示:

然后,点击右上角的【预览】按钮,我们可以看到聊天对话框,在对话框中输入问题和机器人聊天,机器人在回复过程中我们也可以点击查看到具体执行的工作流:

最后,测试整个工作流是否会根据你的问题进行精准分类,并按照不同分支进行回复,具体测试结果可观看下面的一个录屏:

至此,我们今天的分享就结束了,快去动手试试吧


总结

本篇文章我们主要分享了关于如何在Dify上快速搭建一个能够对用户问题进行分类或者意图识别后,根据分类结果自动选择不同的知识库,并结合大语言模型进行问题回复的智能聊天机器人。在该框架搭建中主要使用到了Chatflow工作流以及几个核心节点,主要包括问题分类节点、知识库节点、变量聚合节点、大语言模型节点。在模型选择上也分别选择了通义千问的大语言模型、重排序模型。

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

L5阶段:专题集丨特训篇 【录播课】


四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1155461.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式事务的终极方案:从2PC到Saga模式,Seata在金融级场景的落地实践

大家好,聊下分布式事务。 在单体应用时代,Transactional 一个注解就能搞定一切,ACID(原子性、一致性、隔离性、持久性)那是数据库给我们的承诺。但自从微服务大行其道,数据库被拆得七零八落,这…

别再迷信 Playwright 了,真正决定成败的不是浏览器

我以前也以为,只要页面是 JS 渲染的,上 Playwright 或 Selenium,问题基本就解决了。 后来在一个真实项目里,我用同一个目标站点做了三组对比实验,结论非常清楚: 浏览器自动化解决的是页面执行问题&#xff…

3BHL000406P0100 工业控制模块(ABB)核心特性与应用

3BHL000406P0100是ABB推出的工业级专用控制模块,归属同系列核心备件体系,与3BHL000406P0104等型号技术同源,主打高适配性与运行可靠性,专为逆变器、驱动设备配套控制场景设计。核心功能涵盖驱动信号处理、逻辑运算及精准指令输出&…

【性能测试】1_JMeter_JMeter环境搭建和配置

文章目录一、安装JDK二、安装JMeter三、JMeter基本配置3.1 界面汉化3.2 修改主题一、安装JDK 1、下载安装JDK 官网下载:https://www.oracle.com/ 提示:下载时注意电脑系统是32位或64位 2、配置系统环境变量 我的电脑 —> 属性 —> 高级系统设…

实时多维分析系统架构设计:从理论到实践

实时多维分析系统架构设计:从理论到实践关键词:实时多维分析、系统架构设计、数据处理、分析算法、实践应用摘要:本文围绕实时多维分析系统架构设计展开,从理论基础入手,详细阐述了相关核心概念、算法原理和数学模型。…

【性能测试】6_性能测试基础 _TPS算法

文章目录一、PV和UV二、常用平均并发数计算公式2.1 普通计算方法2.2 二八原则计算方法 (核心指导原则)2.3 按照业务数据进行计算2.3.1 计算模拟用户正常业务操作(稳定性测试) 的并发量2.3.2 计算模拟用户峰值业务操作(…

万字长文!从零开始构建你的第一个 ReAct Agent

其实对于 AI Agent 的介绍已经非常非常多了,简单来说,AI Agent 是一种具备“感知-思考-行动”能力的智能体,它能接收任务,自动推理并调用外部工具完成复杂流程。 而在众多 Agent 架构中,ReAct 框架(Reasoni…

Spark动态分区裁剪:大幅提升查询性能的黑科技

Spark动态分区裁剪:大幅提升查询性能的黑科技 关键词:Spark、动态分区裁剪、查询性能、数据处理、大数据 摘要:本文将深入探讨Spark动态分区裁剪这一能大幅提升查询性能的技术。我们会先介绍其背景知识,然后用通俗易懂的方式解释核…

智能销售管理软件助力企业获客与销售业绩提升

智能销售管理软件的定义与作用智能销售管理软件是集成多种功能的系统,专为提高企业获客效率和销售业绩设计。以VertGrow AI销冠为例,这款软件利用AI引流获客系统,实现自动化的客户获取和关系管理。有了这种智能获客工具,企业可以更…

HBase RegionServer高可用:基于Raft的故障自动恢复实现

HBase RegionServer高可用:基于Raft的故障自动恢复实现 一、引言 (Introduction) 钩子 (The Hook) “昨天晚上11点,我们的实时推荐系统突然崩溃了!” 运维同学的消息让整个团队瞬间清醒。排查后发现,是HBase集群中的一个RegionSer…

2026本科必备10个降AI率工具测评

2026本科必备10个降AI率工具测评 2026年本科生必备降AI率工具测评:为何需要这份榜单? 在人工智能技术不断进步的今天,论文查重系统对AIGC内容的识别能力显著提升。对于2026年的本科生而言,单纯依靠人工改写已难以满足学术规范要求…

航天器用地球地平线传感器行业全景分析:技术演进、竞争格局与市场规模预测(2026–2032)

航天器用地球地平线传感器(以下简称“地球敏感器”)是航天器姿态控制系统(AOCS)的核心载荷,通过探测地球与太空的辐射边界(主流为红外波段),实现航天器相对地球姿态的精准定位。其核…

【AI应用开发工程师】-Gemini写前端的一个坑

Gemini写前端的一个坑:当AI设计师固执己见时… 你的AI助手是否也曾像个固执己见的设计师,坚持用“过气”的Tailwind V3,而你明明知道V4才是真香?别急,这篇文章就是为你准备的“设计师沟通指南”! &#x1f…

刚入行Java如何快速提升自己的实力,让自己更有竞争力?

程序员提升自身核心竞争力最好的方式当然是研究Java开源框架的源码!据不完全统计,现在市面上不管是初级,中级,还是高级岗,面试的时候都有可能会问到源码中的问题,它已经成为程序员常规必备的一个技术点。如…

低成本MEMS寻北仪,如何破解中小矿山掘进定向困局

在智慧矿山建设的浪潮席卷行业之时,大型矿山凭借充足的资金储备,早已配齐各类高精尖定向设备,掘进效率与安全系数双双拉满。然而,占行业绝大多数的中小矿山,却始终被一道难题牢牢困住——想要实现精准掘进,…

做好项目管理的4条潜规则,比埋头干活更管用

项目管理的核心是搞定事、管好人,但只盯着甘特图、里程碑的“硬操作”远远不够。那些藏在流程背后的职场潜规则,往往决定着项目的成败。看懂并顺应这些规则,能让你的项目推进事半功倍。沟通到位,比方案完美更重要 很多项目经理会陷…

大数据领域ClickHouse的资源调度策略

ClickHouse资源调度策略深度解析:从理论到实践的全栈优化 元数据框架 标题:ClickHouse资源调度策略深度解析:从理论到实践的全栈优化 关键词:ClickHouse, 资源调度, MPP架构, 并行处理, 成本模型, 资源组, 负载均衡 摘要:本文以MPP(大规模并行处理)架构为理论基础,系…

数琨创享成功入选江苏省首批入库培育数据企业,踏入数智发展新征程

近日,江苏省数据局正式发布江苏省第一批入库培育数据企业名单。经多轮严格筛选,苏州数琨创享信息技术有限公司凭借在数据领域的综合实力与创新成效,同时成功入选数据服务、数据应用、数据技术培育类型证书。这不仅是对公司数据业务能力、技术…

【AI应用开发工程师】-别让你的模型患上“金鱼记忆症”

AI多轮对话:别让你的模型患上“金鱼记忆症” 你以为多轮对话就是让AI记住聊天历史?太天真了!这就像要求一个人记住整本《战争与和平》的每一个细节,然后立即分析第583页的隐喻意义一样困难。 📖 文章目录(点…

大厂面试必看!这三步快速吃透业务,拿满面试分!

正在备战大厂面试的学弟学妹们注意啦!“如何快速了解一项业务” 绝对是高频必考题,面试官问这个问题,核心就是想考察你的业务理解力和环境适应力,能不能快速上手工作。作为过来人,学长整理了一套亲测好用的回答逻辑&am…