DeepSeek-R1本地部署保姆级教程

一、DeepSeek-R1本地部署配置要求

(一)轻量级模型

▌DeepSeek-R1-1.5B

  • 内存容量:≥8GB 

  • 显卡需求:支持CPU推理(无需独立GPU)

  • 适用场景:本地环境验证测试/Ollama集成调试

(二)中规模模型组

▌DeepSeek-R1-7B

  • 内存容量:≥16GB 

  • 显卡配置:NVIDIA RTX 3070/4060(≥8GB)

  • 典型应用:中等复杂度NLP任务(文本摘要/多语言翻译)

▌DeepSeek-R1-8B

  • 内存容量:≥16GB 

  • 显卡配置:NVIDIA RTX 3070/4060(≥8GB)

  • 典型应用:代码生成/逻辑推理等高精度轻量任务

(三)企业级模型组

 ▌DeepSeek-R1-14B

  • 内存容量:≥32GB

  • 显卡配置:NVIDIA RTX 4090/A5000(≥16GB)

  • 典型应用:长文本语义理解与生成

▌DeepSeek-R1-32B

  • 内存容量:≥64GB

  • 显卡配置:NVIDIA A100 40GB/双路RTX 3090(≥24GB)

  • 典型应用:专业领域高精度推理

(四)超大规模模型组

▌DeepSeek-R1-70B

  • 内存容量:≥128GB 

  • 显卡配置:2x NVIDIA A100 80GB/4x RTX 4090

  • 典型应用:复杂生成式AI任务

▌DeepSeek-R1-671B

  • 内存容量:≥512GB

  • 显卡配置:8x NVIDIA A100/H100多节点集群

  • 典型应用:AGI研究/超大规模AI训练

二、查看本机配置(Windows)

通过组合键Ctrl + Alt + Delete启动任务管理器:

  1. 选择"性能"标签页

  2. 内存检测:物理内存容量显示(附图)

  3. GPU检测:专用显存容量显示(附图)

检测结果:

  • 系统内存:16GB 

  • GPU显存:8GB 

  • 推荐部署方案:DeepSeek-R1-7B模型

三、Ollama框架部署

(一)获取安装包

访问官方仓库:https://ollama.com
选择对应系统版本(Windows/macOS/Linux)

(二)安装流程

执行标准安装程序,默认配置即可完成环境部署

四、DeepSeek-R1模型加载与配置

(一)获取模型指令集

访问模型库:deepseek-r1

(二)命令行部署

  1. Windows+R启动运行窗口

  2. 输入"cmd"启动命令提示符

  3. 执行标准安装指令(附图)

Win+R,然后输入cmd,进入下述界面。

五、可视化交互环境部署

(一)获取CherryStudio

官网下载:https://cherry-ai.com
选择对应系统版本(Windows/macOS)

(二)安装与集成

  1. 完成标准安装流程

  2. 启动后自动检测本地模型(详见附图)

  3. 通过GUI界面进行模型交互

安装好之后,继续下述操作:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/896258.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025-spring boot 之多数据源管理

1、是使用Spring提供的AbstractRoutingDataSource抽象类 注入多个数据源。 创建 DataSourceConfig 配置类 通过spring jdbc 提供的带路由的抽象数据源 AbstractRoutingDataSource import org.springframework.beans.factory.annotation.Autowired; import org.springframew…

keycloak - 开发环境的配置持久化

keycloak - 开发环境的配置持久化 前情提要: Keycloak - docker 运行 & 前端集成 本来是想顺便试一下 Okta 集成的,但是发现 Okta 没有本地的 docker 镜像,他们毕竟是做 Identity as a service……算了…… 更新后的 docker compose 如…

项目实战--网页五子棋(匹配模块)(4)

上期我们完成了游戏大厅的前端部分内容,今天我们实现后端部分内容 1. 维护在线用户 在用户登录成功后,我们可以维护好用户的websocket会话,把用户表示为在线状态,方便获取到用户的websocket会话 package org.ting.j20250110_g…

第4章 4.4 EF Core数据库迁移 Add-Migration UpDate-Database

4.4.1 数据库迁移原理 总结一下就是: 1. 数据库迁移命令的执行,其实就是生成在数据库执行的脚本代码(两个文件:数字_迁移名.cs 数字_迁移名.Designer.cs),用于对数据库进行定义和修饰。 2. 数据库迁移…

Spring Boot + JSqlParser:全面解析数据隔离最佳实践

Spring Boot JSqlParser:全面解析数据隔离最佳实践 在构建多租户系统或需要进行数据权限控制的应用时,数据隔离是一个至关重要的课题。不同租户之间的数据隔离不仅能够确保数据的安全性,还能提高系统的灵活性和可维护性。随着业务的扩展和需…

51单片机编程学习笔记——点亮LED

大纲 器件51单片机开发板总结 安装驱动点亮LED烧录 随着最近机器人爆火,之前写的ROS2系列博客《Robot Operating System》也获得了更多的关注。我决定在机器人领域里再走一步,于是想到可以学习单片机。研究了下学习路径,最后还是选择先从51单…

Java String 类

Java String 类常用方法详解 在 Java 编程里,字符串操作十分常见,而 String 类作为 Java 标准库的核心类,用于表示不可变的字符序列。任何对字符串的修改操作都会返回一个新的字符串对象,不会改变原始字符串。本文将详细介绍 Str…

9.【线性代数】—— 线性相关性, 向量空间的基,维数

九 线性相关性, 向量空间的基,维数 Ax0 什么情况下无解(x不为零向量)1. 向量组的线性无关性2.向量组生成一个空间(S)3. 向量空间的一组基:都满足向量个数相同4. 空间维数 基向量的个数 Ax0 什么情况下无解(x不为零向量) Ax0无解&#xff0c…

蓝桥杯单片机组第十二届省赛第二批次

前言 第十二届省赛涉及知识点:NE555频率数据读取,NE555频率转换周期,PCF8591同时测量光敏电阻和电位器的电压、按键长短按判断。 本试题涉及模块较少,题目不难,基本上准备充分的都能完整的实现每一个功能,并…

opencv:距离变换 cv2.distanceTransform

函数 cv2.distanceTransform() 用于计算图像中每一个非零点像素与其最近的零点像素之间的距离(Distance Transform, DT算法),输出的是保存每一个非零点与最近零点的距离信息;图像上越亮的点,代表了离零点的距离越远。 …

基于Spring Boot的党员学习交流平台设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…

自动驾驶两个传感器之间的坐标系转换

有两种方式可以实现两个坐标系的转换。 车身坐标系下一个点p_car,需要转换到相机坐标系下,旋转矩阵R_car2Cam,平移矩阵T_car2Cam。点p_car在相机坐标系下记p_cam. 方法1:先旋转再平移 p_cam T_car2Cam * p_car T_car2Cam 需要注…

k8s ssl 漏洞修复

针对Kubernetes集群中SSL/TLS协议信息泄露漏洞(CVE-2016-2183)的修复,需重点修改涉及弱加密算法的组件配置。以下是具体修复步骤及验证方法: 一、漏洞修复步骤 1. 修复etcd服务 修改配置文件 : 编辑 /etc/kubernetes/…

数字IC后端培训教程| 芯片后端实战项目中base layer drc violation解析

今天分享一个咱们社区IC后端训练营学员遇到的一个经典DRC案例。这个DRC Violation的名字为PP.S.9(这里的PP就是Plus P)。这一层是属于管子的base layer。更多关于base layer的介绍,可以查看下面这份教程。 https://alidocs.dingtalk.com/api/doc/transit?spaceId5…

从零到一学习c++(基础篇--筑基期十一-类)

从零到一学习C(基础篇) 作者:羡鱼肘子 温馨提示1:本篇是记录我的学习经历,会有不少片面的认知,万分期待您的指正。 温馨提示2:本篇会尽量用更加通俗的语言介绍c的基础,用通俗的语言去…

DeepSeek技术全景解析:架构创新与行业差异化竞争力

一、DeepSeek技术体系的核心突破 架构设计:效率与性能的双重革新 Multi-head Latent Attention (MLA):通过将注意力头维度与隐藏层解耦,实现显存占用降低30%的同时支持4096超长上下文窗口。深度优化的MoE架构:结合256个路由专家…

插入排序:一种简单而直观的排序算法

大家好!今天我们来聊聊一个简单却非常经典的排序算法——插入排序(Insertion Sort)。在所有的排序算法中,插入排序是最直观的一个。 一、插入排序的基本思想 插入排序的核心思想是:将一个待排序的元素,插…

2025年校园网络招聘会汇总

1、卫生健康行业2025届毕业生春季校园网络招聘会 企业数量职位数量岗位数量10020002000 访问地址: https://www.weirenjob.com/zph/zph_wsjkxy2025jbyscjxywlzph/ 2、山东地区面向2025届高校毕业生网络招聘活动 企业数量职位数量岗位数量909271052434 访问地址&a…

Windows 10 GPU STACK 0.5.1 安装

Windows 10 GPU STACK 0.5.1 安装 1 GPUStack 安装1.Python安装(3.10/11/12)2.GPUStack 下载3.生成密码4.访问5.设置模型下载目录6.禁用开机自启并重启服务7.安装模型8.查看安装的进度 2.试验场聊天测试1.对话模式 3.API Key 测试 1 GPUStack 安装 1.Py…

【数据结构】快指针和慢指针

一、 给你单链表的头结点 head ,请你找出并返回链表的中间结点。如果有两个中间结点,则返回第二个中间结点。 要求:只遍历一遍链表 可以使用快慢指针:fast 一次走两步,slow 一次走一步。当 fast NULL(偶数个结点)或…