本地部署deepseek-r1建立向量知识库和知识库检索实践【代码】

目录

一、本地部署DS

二、建立本地知识库

1.安装python和必要的库

2.设置主目录工作区

3.编写文档解析脚本

4.构建向量数据库

三、基于DS,使用本地知识库检索


本地部署DS,其实非常简单,我写了一篇操作记录,我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客

安装了本地DS,我肯定是想建立本地的知识库,还要能结合本地知识库来查询了,不然本地部署,并没有太大的意义,用户主要是不想把提问的附件和知识库送到服务器上,不管怎么样,辛辛苦苦写的论文,做的实验数据,还是不想哪天莫名其妙的被别人检索到的。

有兴趣,或者不想走弯路的朋友,可以看看。运行DS,肯定是很考验机器的,但并不是多么的可怕,没有GPU不要紧,CPU也能跑。我用一台Windows 10pro,没有GPU,跑起来虽然风扇呼呼的,但8b没有什么问题,7b估计更顺滑一些。我把网线拔了也实验了,确实是本地哈哈!上面的文章中,也给了不同版本DeepSeek-R1所需要的电脑配置清单,以及一个检测工具,还是挺好用的。

(我这台电脑的配置)

手头也没有什么好文章,于是就去问DS(满血版)自己,DS对于自己部署自己,给的代码和方式,不是模块不全,就是代码不对,要么是路径错误,把我这好久不碰代码的人,弄得迷迷糊糊,好在调程序的修养还在,不跑通,不出结果,心里痒痒的不行,于是反复提问DS,反复检查,终于也算是初步能看到结果了。

本文给出了解析本地知识库PDF文件、建立向量知识库、集成deepseek-r1:8b版本查询的全过程。

距离真正的商用,当然有距离,代码和示例的伪代码差不多,没有什么保护、架构可言,做一个记录,知行合一,自我启发是够用了。

一、本地部署DS

我部署的是8b版本,基于ollama部署的,很简单。

我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客

部署后,由于要运行python,所以我同时用的powershell和cmd

启动:

ollama run deepseek-r1:8b

很快就可以看到,deepseek-r1:8b版本,就开始运行 。

可以看一下版本。

如果不习惯命令行窗口,想要图形界面,大家还可以下载Docker,运行WebUI,可以试试。我的电脑windows一开始没有升级,无法安装最新的Docker,要升级到19045以上。

刚刚升级了windows,试了下安装成功!

WSL也同时被安装和升级。

这段后续再给大家分享。

二、建立本地知识库

我直接问的DS:

我用ollama已经在windows10环境下部署了deepseek-r1,现在想在本地建设知识库,把我的PDF和WORD等文件装入知识库,我该下载哪些工具和软件,执行哪些操作,需要清晰且可执行性强。我没有nvidia显卡,是共享的显存,但是我的deepseek可以运行,我不求效率和速度,能跑通就可以。

我真是要求不高了,因为确实害怕误导了它,给我放什么大招,我的小笔记本承受不住。

(以下很多内容是反复核实验勘误后的,DS的回答经常有问题。即使是满血版本。)

1.安装python和必要的库

https://www.python.org/downloads/windows/

我安装的版本是

Pyth

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/898431.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

String、StringBuffer、StringBuiler的区别

可变性 String是不可变的,这是因为String内部用于存储数据的char[]数组用了final关键字修饰,而且是private的,并且没有对外提供修改数组的方法。 StringBuffer和StringBuilder是可变的,它们内部的char数组没有用final关键字修饰。…

Certd自动化申请和部署SSL证书并配置https

服务器使用的华为云,之前SSL证书通过配置Cloudflare的DNS实现的,最近华为云备案提示需修改解析至境内华为云IP,若解析境外IP,域名无需备案,需注销或取消接入备案信息,改为使用Certd自搭建证书管理工具&…

git tag以及git

git tag 以及git 一、先说收获吧 1. git bash 在windows上 类似于linux的bash提供的shell命令行窗口,可以执行很多linux命令,cd pwd ls vim cat touch mkdir,还可以用正则匹配查看标签。相当于在windows上装了一个小的linux。git init myproj…

ESP8266通过AT指令配置双向透传

一、固件烧录 IO0接地后上电,进入烧录模式,烧录完成后去掉即可 二、参数配置 1、服务器端 ATCWMODE_DEF2 ATCWSAP_DEF"ESP8266","12345678",5,3 ATSAVETRANSLINK1,"192.168.4.2",9090,"UDP",8080 2、客户端…

【3D模型】【游戏开发】【Blender】Blender模型分享-狮头木雕附导入方法

导入方法: [Blender] 如何导入包含纹理的 .blend 模型文件 在 3D 建模和渲染工作中,Blender 是一款功能强大的免费开源软件。很多时候,我们需要导入 .blend 后缀的模型文件,同时确保纹理(textures)文件夹…

C# | 超简单CSV表格读写操作(轻松将数据保存到CSV,并支持读取还原)

C# | 超简单CSV表格读写操作(轻松将数据保存到CSV,并支持读取还原) 文章目录 C# | 超简单CSV表格读写操作(轻松将数据保存到CSV,并支持读取还原)一、上位机开发中的CSV应用背景二、CSV读写实战教学1. 基本对…

Git push后撤销提交

一、介绍 当某次更改完工程后,push了本地仓库到云端,但是发现有地方改错了,想撤销这次推送,或者某次提交就更改了很小一部分,想和本地这次修改的合并为一次推送,省的在云端显示特别多次提交,显得…

Unity导出WebGL,无法显示中文

问题:中文无法显示 默认字体无法显示中文 在编辑器中设置了中文和英文的按钮,中文按钮无法显示 导出后无法显示中文 解决办法: 自己添加字体,导入项目,并引用 示例 下载一个字体文件,这里使用的阿里…

阅读《Vue.js设计与实现》 -- 02

接上一篇文章:阅读《Vue.js设计与实现》 – 01 文章目录 第二章提升用户的开发体验tips 控制框架代码的体积Tree-Shaking副作用 框架应该输出怎样的构建产物?注意这两个文件有什么区别? 特性开关如何实现? 处理错误TS支持 第二章 …

Mac:Ant 下载+安装+环境配置(详细讲解)

📌 下载 Ant 下载地址:https://ant.apache.org/bindownload.cgi 📌 无需安装 Apache官网下载 Ant 压缩包,无需安装,下载解压后放到自己指定目录下即可。 按我自己的习惯,我会在用户 jane 目录下新建了个…

qt图表背景问题

从代码来看,这段代码涉及到设置背景透明度和背景可见性的操作,主要是在一个基于Qt框架的图形界面程序中对某个图表控件(fontChart)和视图控件(fontChartView)进行操作。以下是每行代码的作用以及它们之间的…

蓝桥杯国赛子串2023动态规划,暴力

#include <bits/stdc.h> using namespace std; // string ss; #define int long long string s; //该方法通过动态规划&#xff0c;找到2023字串&#xff0c;而2023等于202加3&#xff0c;202等于202&#xff0c;20等于20&#xff1b; int f2() {int dp[4]{0};//dp[0]代表…

uni-app——网络API

uni-app 网络API 在 uni-app 开发中&#xff0c;网络请求是获取数据与和服务器交互的重要手段。以下介绍 uni-app 中常见的网络 API&#xff0c;包括发起请求、上传和下载以及 WebSocket、UDP 通信等方面。 发起请求 在 uni-app 里&#xff0c;使用uni.request(OBJECT)来发起…

计算机网络笔记再战——理解几个经典的协议HTTP章3

理解几个经典协议——HTTP章3 返回结果的HTTP状态码 ​ 我们知道&#xff0c;ICMP可以传递IP通信时候的状态如何。HTTP虽然没有辅助的解析&#xff0c;但是它可以使用状态码来表达我们的HTTP请求的结果&#xff0c;标记服务器端的处理是否正常、通知出现的错误等工作。这就是…

国产编辑器EverEdit - Hex Dump插件:看到文本的另一面!

1 Hex Dump插件 1.1 应用场景 有时可能需要显示字母的ASCII编码&#xff0c;或其他文字的字节编码&#xff0c;可以使用Hex Dump插件来完成 1.2 使用方法 安装Hex Dump插件&#xff0c;安装插件方法参考&#xff1a;扩展管理 在编辑器中选中文本&#xff0c;选择扩展 -> …

《驾驭MXNet:深度剖析分布式深度学习训练的高效之道》

在深度学习的迅猛发展进程中&#xff0c;模型的规模和复杂性持续攀升&#xff0c;对计算资源的需求也愈发苛刻。单机训练在面对大规模数据集和复杂模型结构时&#xff0c;常常显得力不从心。分布式深度学习训练成为解决这一困境的关键途径&#xff0c;而MXNet作为一款强大的开源…

Vue3项目开发:状态管理实践指南

# Vue3项目开发&#xff1a;状态管理实践指南 一、引言 背景介绍 在Vue项目中&#xff0c;状态管理是一个非常重要的话题。合理的状态管理能够帮助我们更好地组织和管理数据&#xff0c;提升项目的可维护性和可扩展性。本文将深入探讨Vue3项目中状态管理的最佳实践&#xff0c;…

网络安全漏洞与修复 网络安全软件漏洞

文章目录 一、软件漏洞的概念 1、信息安全漏洞简述2、软件漏洞3、软件漏洞概念4、软件漏洞的成因分析 二、软件漏洞标准化管理 1、软件漏洞分类2、软件漏洞分级3、安全漏洞管理规范 一、软件漏洞的概念 1、信息安全漏洞简述 信息安全漏洞是信息安风险的主要根源之一&…

SpringBoot项目controller层接收对应格式请求的相关RequestMapping配置

目录 &#xff08;1&#xff09; &#xff08;2&#xff09; &#xff08;3&#xff09; 注&#xff1a;此情况注意和&#xff08;4&#xff09;中情况进行区分 &#xff08;4&#xff09; 在几个springboot项目开发后&#xff0c;我总结了以下的一些常见的接收对应请求的…

2025年图生视频模型技术全景解析

一、开源图生视频模型 阿里通义万象Wan2.1系列 I2V-14B-480P&#xff1a; 14B参数基础模型支持480P分辨率图生视频显存需求16GB以上 I2V-14B-720P&#xff1a; 高清增强版模型采用分帧渲染技术&#xff0c;输出分辨率达1280720 技术特性&#xff1a; 支持中文提示词自动解析内置…