打造本地GPT专业领域知识库AnythingLLM+Ollama

        如果你觉得openai的gpt没有隐私,或者需要离线使用gpt,还是打造专业领域知识,可以借用AnythingLLM+Ollama轻松实现本地GPT.

AnythingLLM+Ollama 实现本地GPT步聚:

1 下载 AnythingLLM软件

AnythingLLM官网地址:

AnythingLLM | The ultimate AI business intelligence tool

2 下载 Ollama

Ollama官网下载: 

 Ollama

下载好的两个软件如下图: 

3 安装AnythingLLM

和安装其它软件一样双击安装即可,如下图:

安装成功后,我们接着再安装Ollama。

4 安装Ollama

和安装其它软件一样双击安装即可,安装成功后右下角有个运行图标如下图:

 配置 Ollama

 1 配置Ollama模型数据路径

模型数据默认是保存在C盘的,由于模型数据特别大,所以这里一定要记住配置模型数据的路径,只里设置系统变量OLLAMA_MODELS的值为模型数据保存路径,如下图:

 2 选择配置主模型

  这里考虑到我们平时主要处理中文相关资料,选择阿里的千问模型,结合当前环境笔记是16G内存,我们这里选择千问7b(占用8G内存):

  运行选择的模型

ollama run qwen:7b

首次运行会下载该模型,如下图: 

下载完成,如下图: 

3 选择配置嵌入模型

 嵌入模型并不直接生产数据,主要用于把本地知识doc.pdf txt等文档保存在向量数据库时用到。

这里我们选择 nomic-embed-text ,它是具有大型令牌上下文窗口的高性能开放嵌入模型。

ollama pull nomic-embed-text

5 配置AnythingLLM

打开AnythingLLM 进行设置项,如下图:

1 配置主模型

这里选择上面Ollama下载的千问模型

2 配置嵌入模型

这里选择配置与上面安装的模型nomic-embed-text一致,如下图:

配置嵌入模型在处理上传知识文件保存到向量数据时两个关键参数:

  •   分块大小 (这是单个向量中允许存在的最大字符数量。例如,如果设置为8192,意味着每个文本块或向量最多包含8192个字符。)
  •  文本块重叠度(这是指在两个相邻文本块切分过程中允许的最大字符重叠量。设置重叠可以帮助保持信息的连续性,避免因严格切分导致的语义断裂,尤其是在信息的关键边界附近。)

  注意:这两个参数仅适用于新嵌入的文档,对已存在的文档没有影响。 

 3 配置使用向量数据库

设置使用向量数据库,没有特别需求使用默认即可,如下图:

 说明:LanceDB是一个开源的无服务器向量数据库,专为处理人工智能应用中的大规模多模态数据(如文本、图像、视频、点云等)而设计。它简化了高维向量的检索、过滤和管理过程,无需用户管理和维护服务器基础设施,从而降低了运维成本并提高了开发效率。 

配置完成,如下图: 

 

6 开始使用本地GPT(使用AnythingLLM)

现在我们开始使用AnythingLLM:

1 创建空间

  AnythingLLM 有一个很好的概念工作空间,有点像我们平时用eplise创建项目一样,一个项目一个空间,不同的空间还可以单独配置,这样可以很好的划分不同类类型的专业领域。

 保存空间名称后,即可正常提问

开始问答:

因为是离线,而本地又没有显卡,所以回答问题时并不是很快,而且CPU会拉升,如下图: 

 ollama 服务CPU占用50%,内存12G,消耗挺大的。

2 可选择单独配置参数

  为当前空间单独配置参数(默认使用设置中的配置) 

配置聊天模型,这个配置很重要,如果只是针对知识库直接设置成查询模型即可,如下图: 

 

3 知识库使用

 上传文档形成专业知识库,如下图:

选择文档上传,如下图: 

 

 

或者输入网址直接获取内容 

 使用查询模型提问,直接使用知识库如下图:

小结,普通的笔记本电脑在使用查询模式会比聊天模型更快,并且可以节约CPU与内存。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/11907.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

功能卓越,未来可期!实在Agent智能体公测圆满收官

“被需要的智能才是实实在在的智能。”一直以来,实在智能始终坚持从行业本质出发思考如何围绕客户需求打造更智能、更普惠的智能体数字员工,切实关注用户真实的使用体验与感受。 自2020年7月起,实在智能率先推出第一代实在RPA数字员工&#…

SpringBoot设置默认文件大小

1、问题发现 有个需求,上传文件的时候,发现提示了这个错误,看了一下意思是说,文件超过了1M。 看我们文件的大小: 发现确实是,文件超出了1M,查了一下资料,tomcat默认上传文件大小为1M…

Python环形数组

在编程中,环形数组(Circular Array)是一种特殊的数组结构,其中最后一个元素连接到第一个元素,形成一个环形。这种结构在某些算法问题中很有用,例如约瑟夫环问题(Josephus Problem)。…

简单粗暴的翻译英文pdf

背景:看书的时候经常遇到英文pdf,没有合适的翻译软件可以快速翻译全书。这里提供一个解决方案。 Step 1 打开英文pdfCTRLA全选文字CTRLC复制打开记事本CTRLV复制保存为data.txt Step 2 写一个C脚本 // ToolPdf2Html.cpp : 此文件包含 "main&quo…

大型语言模型自我进化综述

24年4月来自北大的论文“A Survey on Self-Evolution of Large Language Models”。 大语言模型(LLM)在各个领域和智体应用中取得了显着的进步。 然而,目前从人类或外部模型监督中学习的LLM成本高昂,并且随着任务复杂性和多样性的…

子模块介绍,开发规范说明和工具类封装

在上一章的内容中&#xff0c;我们完成了聚合工程的搭建以及工程依赖的导入 当然我们会延续上一章的传统提供一个传送门给各位&#xff0c;如未完成上一章内容&#xff0c;请点击左侧->传送门 概述子模块 上一章我们已经创建了整个聚合工程 该聚合工程有以下子模块 <…

如何将一个Web应用部署到 Kubernetes 集群

Kubernetes&#xff08;常简称为 k8s&#xff09;是一个是一个开源的容器编排平台&#xff0c;由 Google 设计并捐赠给 Cloud Native Computing Foundation&#xff08;CNCF&#xff09;的开源平台。它旨在提供一个标准化的容器部署流程&#xff0c;让部署、扩展和管理应用程序…

C# WinForm —— 18 NumericUpDown 介绍

1. 简介 数字显示框&#xff0c;通过向上、向下按钮来 增加/减小 显示的数值 2. 常用属性 属性解释(Name)控件ID&#xff0c;在代码里引用的时候会用到,一般以 numUD 开头Hexadecimal数值 up-down 控件的值是否应以十六进制显示Increment每单击一下按钮&#xff0c;增加或减…

springboot基本使用十(搭建jpa)

jpa底层是hibernate,(ORM)对象关系映射技术 jpa依赖: <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-jpa</artifactId> </dependency> 配置文件: server:port: 8088Spring:datasou…

音源分离|Music Source Separation in the Waveform Domain

一、文章摘要 本文中&#xff0c;比较了两种时域结构。首先将最初为语音源分离而开发的卷积tasnet应用于音乐源分离任务。虽然ConvTasnet击败了许多现有的频域方法&#xff0c;但正如人类评估所显示的那样&#xff0c;它存在明显的artifacts。本文提出了一种新的时域模型Demucs…

鸿蒙内核源码分析 (协处理器篇) | CPU 的好帮手

本篇很重要&#xff0c;对CP15协处理所有16个寄存器一一介绍&#xff0c;可能是全网介绍CP15最全面的一篇&#xff0c;鸿蒙内核的汇编部分(尤其开机启动)中会使用&#xff0c;熟练掌握后看汇编代码将如虎添翼。 协处理器 协处理器 (co-processor) 顾名思义是协助主处理器完成…

服务器渲染和客户端渲染:解析服务器渲染(SSR)和客户端渲染(CSR)的概念,各自的优点和缺点,并比较如Next.js, Nuxt.js等解决方案

首先从概念上区分&#xff0c;服务器渲染&#xff08;Server-side Rendering&#xff0c;简称 SSR&#xff09;和客户端渲染&#xff08;Client-side Rendering&#xff0c;简称 CSR&#xff09;主要的区别在于页面的渲染地点不同&#xff1a; 服务器渲染&#xff0c;即 SSR&am…

韵搜坊(全栈)-- 前后端初始化

文章目录 前端初始化后端初始化 前端初始化 使用ant design of vue 组件库 官网快速上手&#xff1a;https://www.antdv.com/docs/vue/getting-started-cn 安装脚手架工具 进入cmd $ npm install -g vue/cli # OR $ yarn global add vue/cli创建一个项目 $ vue create ant…

社交媒体数据恢复:默往

如果你在默往社交软件中丢失了重要的数据&#xff0c;不要着急&#xff0c;以下是一些步骤可以帮助你进行数据恢复&#xff1a; 登录账号&#xff1a;首先&#xff0c;你需要登录默往社交软件账号&#xff0c;确保你已经登录了正确的账号&#xff0c;因为如果你登录了错误的账号…

邦芒简历:如何恰当呈现跳槽经历在简历中

在职业生涯中&#xff0c;跳槽往往伴随着个人的成长与选择。然而&#xff0c;频繁或不当的跳槽记录可能会给HR留下不稳定的印象。因此&#xff0c;在撰写简历时&#xff0c;如何恰当地呈现跳槽经历就显得尤为重要。 1、短期工作经历的处理 对于短期工作经历&#xff08;尤其是…

弘君资本策略:股指预计保持震荡上扬格局 关注公用事业、电网设备等板块

弘君资本指出&#xff0c;周一A股商场探底上升、小幅震动收拾&#xff0c;早盘股指低开后震动回落&#xff0c;沪指盘中在3126点附近取得支撑&#xff0c;午后股指企稳上升&#xff0c;盘中电网设备、公用事业、电力以及工程建造等职业体现较好&#xff1b;半导体、互联网以及软…

掌握社交的这二十个心理技巧

1.自信&#xff1a;这一点说起来容易做起来难&#xff0c;但就算是假装出来的自信&#xff0c;通过你的肢体语言表现出来。在很大程度也可以帮助你留下很好的第一印象。人们喜欢自信的人。因为他们更可靠&#xff0c;更值得信赖&#xff0c;更具吸引力。 2.当你第一次见到某人…

PXE+Kickstart无人值守安装安装Centos7.9

文章目录 一、什么是PXE1、简介2、工作模式3、工作流程 二、什么是Kickstart1、简介2、触发方式 三、无人值守安装系统工作流程四、实验部署1、环境准备2、服务端&#xff1a;关闭防火墙和selinux3、添加一张仅主机的网卡4、配置仅主机的网卡4.1、修改网络连接名4.2、配IP地址4…

差异基因散点图绘制教程

差异基因散点图绘制教程 本期教程 小杜的生信笔记&#xff0c;自2021年11月开始做的知识分享&#xff0c;主要内容是R语言绘图教程、转录组上游分析、转录组下游分析等内容。凡事在社群同学&#xff0c;可免费获得自2021年11月份至今全部教程&#xff0c;教程配备事例数据和相…

最新版Ceph( Reef版本)块存储简单对接k8s(上集)

当前ceph 你的ceph集群上执行 1.创建名为k8s-rbd 的存储池 ceph osd pool create k8s-rbd 64 642.初始化 rbd pool init k8s-rbd3 创建k8s访问块设备的认证用户 ceph auth get-or-create client.kubernetes mon profile rbd osd profile rbd poolk8s-rbd部署 ceph-rbd-csi c…