程序员必看:Docker+Dify+DeepSeek本地部署大模型+知识库完整教程(含实操,建议收藏)

本文详细介绍了如何使用Docker、Dify和DeepSeek搭建本地大模型系统。通过安装Docker环境,部署Dify平台,配置DeepSeek和bge-large模型,上传私有知识库,最终创建个性化AI助手。这种本地部署方式能让大模型学习个人专业知识,实现高效查询,无需依赖官方平台,特别适合医生、研究人员等需要专业资料支持的用户。


前几天写了一篇如何本地部署DeepSeek的文章。很多小伙伴问本地部署有什么意义

本地部署的最大意义在于利用DeepSeek大模型的能力加上自己的知识库,可以训练出一个符合自己需求的大模型。

想象下如果你是一个医生,有一堆科研资料。你想拥有一个大模型机器人,学习了你所有的资料。每当你想查科研资料找到答案的时候,自己问这个机器人就好了。省去了自己很多查找资料的时间

这就是本地部署+知识库的作用。是DeepSeek官网不具备的。因为这是训练的你的私有资料。

今天就来分享下这个搭建过程。用到的工具组合是Docker+Dify+DeepSeek

Dify是基于LLM的大模型知识库问答系统,里面集成DeepSeek以及私有知识库,而Dify采用Docker的方式来安装

01

下载安装Docker

首先在docker网站 https://www.docker.com/ 下载docker

有Mac,linux,windows可供选择。我的电脑是windows系统的,因此下载Windows的。

安装完成后,重启系统生效。打开登录就可以使用

02

安装Dify

登录网址 https://github.com/langgenius/dify

点击Dnowload ZIP。下载到本地并解压。注意: 在本地的保存路径不要有中文字符。否则后续运行会失败

windows进入powershell(不是CMD)。进入dify解压包下面的docker目录,分别执行下面两条命令

cp .env.example .env

docker -compose up -d

docker会拉取dify进行下载

大概时间20分钟左右。下载完成

重启docker 桌面软件,在containers中能看到docker的这个image,表示Dify下载成功。Status显示Running表示正在运行。

03

本地部署DeepSeek

这里需要部署的是DeepSeek以及bge-large。DeepSeek的部署方法参考我之前的写的部署教程

DeepSeek崩了不用怕,3步快速搞定DeepSeek本地部署

同时在ollama中搜索bge-large。点击进入后复制命令

在命令窗口中执行复制的命令进行下载。

04

Dify配置大模型

在浏览器中输入:http://localhost/signin

来到dify的登录界面进行登录

进入设置

在模型供应商中找到ollama,点击添加大模型

基础URL填 http://host.docker.internal:11434

其他的都不变,点击保存。

添加完后能看到对应的模型

再继续添加Text Embedding。这是为知识库添加bge-large模型

添加完成后,能看到2个模型。这样就算配置完了

05

搭建知识库

来到Dify的主界面,点击知识库。创建新的知识库

上传文档,点击下一步

知识库 的配置可以采用默认的,拉到最下面点击保存并处理

会进行知识库的创建,显示嵌入已完成。代表知识库导入成功

点击前往文档,可以看到文档已经被分段处理。

06

创建应用

在工作室中创建空白应用

创建聊天助手

在聊天界面中点击添加上下文,也就是你创建的知识库。

将刚才创建的知识库导入进去。

此时在右边的对话框中就可以输入,大模型会根据知识库进行查询。在最后的界面中能看到引用自刚才创建的知识库文件。

知识库创建好后,你可以本地使用,如果想外部访问这个知识库,可以添加外部知识库API。配置好API Endpoint后就可以。

当然,想要让外部访问到,你自己的机器网络也需要在公网上。

如何系统的学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

01.大模型风口已至:月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长,根据工信部最新数据:

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K(数据来源:BOSS直聘报告)

70%企业存在"能用模型不会调优"的痛点

真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!

02.大模型 AI 学习和面试资料

1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)





第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1131679.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SnapShot硬盘备份软件:一款小巧强大的德国军工级数据备份方案

在系统维护、数据迁移和灾难恢复场景中,一款可靠、快速的备份工具至关重要。与Acronis True Image、Ghost等大型商业软件不同,Drive SnapShot​ 以其“小而美”的设计哲学脱颖而出。它用极小的体积实现了专业级备份软件的核心功能,尤其适合技…

【干货收藏】RAG调优完整指南:从基础到GraphRAG,提升大模型回答准确率

文章详解RAG系统调优方法,包括知识库优化(检索优化、知识沉淀、健康度检查)、高级召回排序技术(混合检索、重排序、查询扩展)及GraphRAG解决复杂查询。提出三阶段进阶路径:起步期优化分词和混合检索&#x…

mysql的分区表

1.SQL表创建 下面以时间范围进行创建(每月一个分区,表中创建了四个月的分区) 创建:CREATE TABLE test_table ( id INT NOT NULL AUTO_INCREMENT, content VARCHAR(255), create_time DATETIME NOT NULL,PRIMARY KEY (id, creat…

保姆级教程:使用Dify搭建知识库+Ollama部署本地模型,零基础也能轻松上手!

本文详细介绍了两大步骤:首先讲解如何安装配置Dify并调整文件上传限制;其次指导使用Ollama部署本地模型,包括安装配置、监听设置及模型名称获取。通过本教程,读者可掌握搭建个人知识库和本地AI服务的完整流程,适合想要…

最新APP导航下载页系统源码 带后台

非常好看的一款App导航推荐页源码,带后台,这是一款PHP源码,Thinkphp框架,这款源码安装非常便捷干净,后台添加应用及轮播广告也非常方便,网站自适应PC手机自适应,喜欢的自行部署吧!安…

AI产品经理进阶指南+大模型全栈学习路线:104G资源包助你从零到实战

文章详解AI产品经理与通用产品经理的区别、必备技能及转型路径,并系统介绍大模型七大学习阶段,从系统设计到行业应用实战。同时提供100套AI商业化方案、全套视频教程和200本PDF书籍等资源,帮助程序员和小白系统掌握大模型技术,实现…

深度学习毕设选题推荐:基于python_CNN卷积神经网络对甜点识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

公众号图片圆角与阴影样式配置实战(以135编辑器为例)

摘要:本文聚焦公众号图片圆角(border-radius)与阴影(box-shadow)样式配置的核心需求,以135编辑器为实操案例,从操作步骤、参数解析到避坑指南,全流程拆解可视化样式配置的实现逻辑。…

千寻运动助手V3.1小程序源码 全开源版

会员积分流量主自动化任务全功能上线基于PHPMySQL的运动步数管理助手,支持VIP自动任务、积分体系、流量主变现,打造专属健康运动小程序项目简介:运动健康领域的全能助手在全民健身和数字化健康管理的时代背景下,一款能够激励用户运…

基于C++Qt实现邮政客户投诉工单处理系统[2026-01-07]

基于CQt实现邮政客户投诉工单处理系统[2026-01-07] 项目介绍 邮政客户投诉工单处理系统是一个基于Qt框架开发的信息管理系统,主要用于处理邮政客户的投诉工单,实现了投诉工单的创建、处理、审核、统计等全流程管理。系统支持多角色权限管理&#xff0c…

《计算机网络》深入学:组帧

在计算机网络的世界里,物理层像是一个不知疲倦的搬运工,它只负责传输比特流(0 和 1),却并不关心这些比特代表什么意义。 而数据链路层(Data Link Layer) 的核心任务之一,就是把这些…

MySQL数据误删或者误更新如何恢复(详细步骤,一看就会)

目录 本篇文章适用场景 一、下载MyFlash工具二、误删数据恢复 先检查MySQL有没有开启binlog日志演示误删除数据利用MyFlash工具 反写SQL利用mysqlbinlog 执行反写的sql二进制文件恢复完成 三、误更新数据恢复 演示误更新数据查看binlog最近的更新记录 ,确定起始、结…

空间计算开发者技能指南 2026

空间计算时代的来临:定义、生态与技术共振 “空间计算”(Spatial Computing)不仅仅是营销术语,它标志着计算平台从二维屏幕向三维物理空间的范式转移。虽然 Apple 将 visionOS 定义为空间计算操作系统,但在更广泛的开…

通信协议仿真:通信协议基础_(7).协议仿真的工具与软件

协议仿真的工具与软件 在通信协议仿真领域,选择合适的工具和软件是至关重要的。这些工具和软件可以帮助我们更高效地设计、实现和测试通信协议。本节将详细介绍一些常用的协议仿真工具及其使用方法,包括NS-3、OMNeT++、MATLAB等。 1. NS-3 NS-3(Network Simulator 3)是一…

你画我猜计时答题对战房间酒馆互动神器H5开源

让我为您介绍这个"云起SAAS小酒馆互动H5"系统。 系统介绍 这是一个云起SAAS小酒馆互动H5系统,一个完整的双人对战游戏平台。 核心功能 1. 双人游戏模式计时答题对战: 双方同步答题,统计得分和用时,得分高且用时短者胜,输方接受惩罚你画我猜对战: 一人画一人猜,画手完…

《庄子》导读

《庄子》是战国时期道家学派的经典著作,由庄周及其后学共同撰写,全书现存 33 篇,分为内篇 7 篇、外篇 15 篇、杂篇 11 篇。学界普遍认为,内篇为庄子本人所著,集中体现核心思想;外篇、杂篇多为弟子及后学阐发…

mysql数据被误删的恢复方案

文章目录 一、使用备份恢复二、使用二进制日志(Binary Log)三、使用InnoDB表空间恢复四、使用第三方工具预防措施 数据误删是一个严重的数据库管理问题,但通过合理的备份策略和使用适当的恢复工具,可以有效地减少数据丢失的风险…

【复杂网络分析】从直觉上理解《Stability of graph communities across time scales》

我刚接触社区发现时,最头疼的三个问题的是:到底什么是“好社区”?不同算法的结果为啥差这么多?模块化、谱聚类这些方法看着八竿子打不着,有没有内在联系?我们组的《Stability of graph communities across time scales》这篇经典论文,把这些经典方法串成了一张逻辑自洽的…

《庄子》核心篇章的思维导图框架

一、核心篇章总览内篇(必读,庄子核心思想载体)外篇/杂篇(选读,思想延伸与补充)二、内篇(必读)1. 《逍遥游》核心主题:“无待”的绝对逍遥境界关键意象:大鹏、…

通信原理篇---常见的调制方式

核心思想:为什么要调制?想象你要把一份秘密情报(信息)送到远方。问题1:情报是一张纸(低频信号),你自己跑步去送(低频电磁波),速度慢、传不远、还容…