本地Deepseek添加个人知识库(Page Assist/AnythingLLM)

本地Deepseek两种方法建立知识库

  • 前言 (及个人测试结论)
  • 法一、在Page Assist建立知识库
    • step1 下载nomic-embed-text
    • step2 加载进Page Assist
    • step3 添加知识
    • step4 对话框添加知识库
  • 法二、在AnythingLLM建立知识库
    • 准备工作
      • 1.下载nomic-embed-text
      • 2.下载AnythingLLM
      • 3.创建工作区,进行设置
        • 3.1 聊天设置设置
        • 3.2 向量数据库
        • 3.3 代理配置
      • 4.进入软件设置
        • 4.1 向量数据库
        • 4.2.嵌入首选项
    • 上传文档
    • 测试

前言 (及个人测试结论)

本贴 是在本地部署Deepseek的基础上进行的,部署方法见上一篇帖子win10部署本地deepseek-r1,chatbox,deepseek联网(谷歌网页插件)。

参考视频:【AI】如何用RAG投喂数据给你的deepseek?

想要获得自己的私人助手,需要喂相关的知识(RAG),这就需要建立知识库
建立知识库 需要先有一个量化工具(nomic-embed-text)。

ds的模型越大,回答的越理想。因设备条件差,只能用1.5b的进行测试。
方法一、在谷歌插件Page Assist中投喂数据,较为方便。大pdf可以成功,但是回答的不理想。

方法二、AnythingLLM可以使用pdf、文本、音频、视频(音频、视频我没测试).

注意:刚测试发现pdf的质量 也影响测试结果,扫描的pdf教材之类的影印书籍,他在转化RAG的时候可能就存在问题了。所以影印书籍不适合投喂学习。

法一、在Page Assist建立知识库

step1 下载nomic-embed-text

ollama官网->models->nomic-embed-text在这里插入图片描述
cmd进终端输入(依然默认进了系统盘)

ollama pull nomic-embed-text

下载完成,进Page Assist的设置->RAG设置->文本嵌入模型:nomic-embed-text

在这里插入图片描述
我下了几次,前几次都下完没显示success,只有跳success后,

step2 加载进Page Assist

刷新Page Assist的设置页面,文本嵌入模型 才会有显示
在这里插入图片描述

step3 添加知识

管理知识->添加知识
在这里插入图片描述
我添加了一篇论文,进行测试,添加后,稍等一下,状态就会变成已完成。
在这里插入图片描述

step4 对话框添加知识库

回到首页,添加知识库,
在这里插入图片描述

法二、在AnythingLLM建立知识库

在本地已经部署deepseek的基础上进行。
还需要先去下载一个下载nomic-embed-text。
参考视频:【AI】如何用RAG投喂数据给你的deepseek?
参考:Ollama结合Anything LLM搭建本地AI大模型

准备工作

1.下载nomic-embed-text

ollama官网->models->nomic-embed-text在这里插入图片描述
cmd进终端输入(依然默认进了系统盘)

ollama pull nomic-embed-text

下载完成,进Page Assist的设置->RAG设置->文本嵌入模型:nomic-embed-text

在这里插入图片描述
我下了几次,前几次都下完没显示success,只有跳success后才是真的成功。

2.下载AnythingLLM

下载地址:AnythingLLM
安装速度 比想象中的慢 ~ 很 ~ 多 ~
在这里插入图片描述
安装后,经过一大段导航(不停的点下一页),进入页面。
在这里插入图片描述

3.创建工作区,进行设置

在这里插入图片描述

3.1 聊天设置设置

聊天设置选择ollama,deepseek。
然后要拉到最下面点“Update workspace”
在这里插入图片描述

3.2 向量数据库

向量数据库 :喂给ds的文档,他会变成向量,向量的大小
暂时不设置

3.3 代理配置

选择ollama,自己之前部署的模型,然后点== “Update workspace”==
在这里插入图片描述

4.进入软件设置

设置完模型,还需要一个能够把”文本转变成ds读取的向量“的模型。所以需要回到大的设置
在这里插入图片描述
顺手修改下ds思考的语言。
在这里插入图片描述

4.1 向量数据库

用默认的LanceDB就行在这里插入图片描述

4.2.嵌入首选项

选择ollama, nomic-embed-text。点击保存
在这里插入图片描述

上传文档

在这里插入图片描述
上传60多兆的pdf教材,报错了(我怀疑是 要修改下读取的参数值,我先试试)。
上传几兆的文献成功了。
在这里插入图片描述
点:save and embed
在这里插入图片描述

测试

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/68877.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Node.js 全局对象

Node.js 全局对象 引言 在Node.js中,全局对象是JavaScript环境中的一部分,它提供了对Node.js运行时环境的访问。全局对象在Node.js中扮演着重要的角色,它使得开发者能够访问和操作Node.js的许多核心功能。本文将详细介绍Node.js的全局对象,包括其特点、常用方法和应用场景…

记8(高级API实现手写数字识别

目录 1、Keras:2、Sequential模型:2.1、建立Sequential模型:modeltf.keras.Sequential()2.2、添加层:model.add(tf.keras.layers.层)2.3、查看摘要:model.summary()2.4、配置训练方法:model.compile(loss,o…

Android 音视频 --- EGL介绍和使用

EGL的功能 EGL API作为一套与OpenGL ES各个版本相互独立的API,其作用主要是管理绘图表面。EGL提供以下机制: 与设备的原生窗口系统通信查询绘图表面的可用类型和配置创建绘图表面在OpenGL ES3.0或其他渲染API之间同步渲染管理纹理贴图等渲染资源

【Proteus】NE555纯硬件实现LED呼吸灯效果,附源文件,效果展示

本文通过NE555定时器芯片和简单的电容充放电电路,设计了一种纯硬件实现的呼吸灯方案,并借助Proteus仿真软件验证其功能。方案无需编程,成本低且易于实现,适合电子爱好者学习PWM(脉宽调制)和定时器电路原理。 一、呼吸灯原理与NE555功能分析 1. 呼吸灯核心原理 呼吸灯的…

grpc 和 http 的区别---二进制vsJSON编码

gRPC 和 HTTP 是两种广泛使用的通信协议,各自适用于不同的场景。以下是它们的详细对比与优势分析: 一、核心特性对比 特性gRPCHTTP协议基础基于 HTTP/2基于 HTTP/1.1 或 HTTP/2数据格式默认使用 Protobuf(二进制)通常使用 JSON/…

文字投影效果

大家好,我是喝西瓜汁的兔叽,今天给大家分享一个常见的文字投影效果。 效果展示 我们来实现一个这样的文字效果。 思路分析 这样的效果如何实现的呢? 实际上是两组相同的文字,叠合在一块,只不过对应的css不同罢了。 首先&…

deepseek使用教程

一、准备工作 注册账号 访问 DeepSeek 官网(如 https://www.deepseek.com/)或对应平台。完成注册并登录,部分服务可能需要企业认证或申请权限。 获取 API 密钥(如使用 API) 进入控制台或开发者页面,创建 A…

Hutool工具类

Hutool 是一个非常流行的 Java 工具类库,它提供了丰富的功能来简化开发中的常见任务,比如文件操作、加密、日期处理、字符串操作、数据库工具等。它是一个轻量级的工具库,可以减少开发者编写常用代码的工作量,提高开发效率。 主要…

正态分布与柯西分布的线性组合与副本随机变量同分布

正态分布与柯西分布的线性组合与副本随机变量同分布 对于标准差为 σ \sigma σ,期望为0的正态分布,其概率密度函数为 f ( x ) 1 2 π σ exp ⁡ − x 2 2 σ 2 f(x) \frac{1}{\sqrt{2\pi}\sigma}\exp^{-\frac{x^2}{2\sigma^2}} f(x)2π ​σ1​exp−…

【C++语言】卡码网语言基础课系列----13. 链表的基础操作I

文章目录 背景知识链表1、虚拟头节点(dummyNode)2、定义链表节点3、链表的插入 练习题目链表的基础操作I具体代码实现 小白寄语诗词共勉 背景知识 链表 与数组不同,链表的元素存储可以是连续的,也可以是不连续的,每个数据除了存储本身的信息…

图像处理之图像灰度化

目录 1 图像灰度化简介 2 图像灰度化处理方法 2.1 均值灰度化 2.2 经典灰度化 2.3 Photoshop灰度化 2.4 C语言代码实现 3 演示Demo 3.1 开发环境 3.2 功能介绍 3.3 下载地址 参考 1 图像灰度化简介 对于24位的RGB图像而言,每个像素用3字节表示&#xff0…

MySQL的GROUP BY与COUNT()函数的使用问题

在MySQL中,GROUP BY和 COUNT()函数是数据聚合查询中非常重要的工具。正确使用它们可以有效地统计和分析数据。然而,不当的使用可能会导致查询结果不准确或性能低下。本文将详细讨论 GROUP BY和 COUNT()函数的使用方法及常见问题,并提供相应的…

【课题推荐】基于t分布的非高斯滤波框架在水下自主导航中的应用研究

水下自主导航系统在海洋探测、环境监测及水下作业等领域具有广泛的应用。然而,复杂的水下环境常常导致传感器输出出现野值噪声,这些噪声会严重影响导航信息融合算法的精度,甚至导致系统发散。传统的卡尔曼滤波算法基于高斯噪声假设&#xff0…

知识库管理系统为企业赋能与数字化转型的关键解决方案分析

内容概要 在当今快速发展的商业环境中,知识库管理系统成为企业进行数字化转型的重要支撑工具。这类系统不仅可以帮助企业高效整合和管理其知识资产,还能提升信息共享与沟通的效率。通过科学的知识管理策略,企业可以在动态市场中实现精益管理…

HTML(快速入门)

欢迎大家来到我的博客~欢迎大家对我的博客提出指导,有错误的地方会改进的哦~点击这里了解更多内容 目录 一、前言二、HTML基础2.1 什么是HTML?2.2 认识HTML标签2.2.1 HTML标签当中的基本结构2.2.2 标签层次结构 2.3 HTML常见标签2.3.1 标题标签2.3.2 段落标签2.3.3…

线性代数复习笔记

1. 课程学习 1.1 3Blue1Brown 线性代数 2. 基本术语 eigenvector(特征向量):线性变换中方向保持不变的向量 可以视作3D旋转矩阵形成的旋转的轴

vue入门到实战 二

目录 2.1 计算属性computed 2.1.1什么是计算属性 2.1.2 只有getter方法的计算属性 2.1.3 定义有getter和setter方法的计算属性 2.1.4 计算属性和methods的对比 2.2 监听器属性watch 2.2.1 watch属性的用法 2.2.2 computed属性和watch属性的对比 2.1 计算属性computed…

Python从0到100(八十六):神经网络-ShuffleNet通道混合轻量级网络的深入介绍

前言: 零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Pyth…

Baklib赋能企业实现高效数字化内容管理提升竞争力

内容概要 在数字经济的浪潮下,企业面临着前所未有的机遇与挑战。随着信息技术的迅猛发展,各行业都在加速推进数字化转型,以保持竞争力。在这个过程中,数字化内容管理成为不可或缺的一环。高效的内容管理不仅能够优化内部流程&…

springboot中路径默认配置与重定向/转发所存在的域对象

Spring Boot 是一种简化 Spring 应用开发的框架,它提供了多种默认配置和方便的开发特性。在 Web 开发中,路径配置和请求的重定向/转发是常见操作。本文将详细介绍 Spring Boot 中的路径默认配置,并解释重定向和转发过程中存在的域对象。 一、…