【大模型】Ubuntu下安装ollama,DeepSseek-R1:32b的本地部署和运行

1 ollama 的安装与设置

ollama官网链接:https://ollama.com/

  • 在左上角的【Models】中展示了ollama支持的模型
  • 在正中间的【Download】中课可以下载支持平台中的安装包。
    在这里插入图片描述

其安装和模型路径配置操作流程如下:

  1. ollama的安装
    这里选择命令安装
    curl -fsSL https://ollama.com/install.sh | sh
    
    正确安装后,查看安装的ollama版本
    ollama --version
    
  2. 启动ollama服务
    ollama serve
    
    若报端口被占用,则查看端口的使用情况
    sudo lsof -i :11434
    
  3. 下载模型默认路径的修改(可选,推荐)
    正常来说,就可以下载和运行模型了。但大模型一般来说比较大,最好将模型下载默认路径设置在挂载的数据盘上。默认情况下,ollama模型的存储目录为 /usr/share/ollama/.ollama/models
    修改默认路径的操作如下:
    • 创建路径并修改权限
      # 这里设置路径为 /opt/ai-platform/lldataset/ollama/
      sudo mkdir /opt/ai-platform/lldataset/ollama/
      sudo chmod -R 777 /opt/ai-platform/lldataset/ollama/
      
    • 停止服务并修改配置文件
      sudo systemctl stop ollama
      sudo nano /etc/systemd/system/ollama.service
      
      打开文件后,添加内容
      Environment="OLLAMA_MODELS=/opt/ai-platform/lldataset/ollama/"
      Environment="OLLAMA_HOST=0.0.0.0:11434"# 按下 Ctrl + O 保存文件。
      # 按下 Enter 确认保存。
      # 按下 Ctrl + X 退出编辑器。
      
    • 启动ollama并查看其状态
      sudo systemctl daemon-reload
      sudo systemctl restart ollama.servicesudo systemctl status ollama.service
      
      若正确启动则如下图在这里插入图片描述

2 ollama运行大模型

ollama下载和运行大模型跟简单,即ollama run <模型名称>。若未下载,则先下载再运行;若已下载,则试接运行。
实际使用中,需要根据自己设备资源支持,去下载某个大模型的某个版本。以deepseek-r1为例,具体操作为:

  1. 搜索栏中搜索【deepseek-r1】
    在这里插入图片描述
  2. 根据自己服务器的显存大小,选择合适的模型版本。复制命令
    ollama run deepseek-r1:32b
    
    在这里插入图片描述
    拉取成功后即可进行问答。从deepseek回答的think中,能看出它是个讨好型的大模型…
    在这里插入图片描述
    在这里插入图片描述

3 DeepSeek-R1-Distill-Qwen-32B的简单介绍

DeepSeek R1

  • 是一款拥有 6710 亿参数的大型混合专家(MoE)模型。通过强化学习(RL)和监督微调(SFT)相结合的方式训练,DeepSeek R1 的推理能力得到了显著提升。

DeepSeek-R1-Distill-Qwen-32B
通过将 DeepSeek R1 的推理模式蒸馏到更小的模型中,实现了更高效的性能。 在该模型中

  • DeepSeek 和 Qwen 的关系是基于知识蒸馏的师生关系:

    • DeepSeek-R1 是教师模型:它是一个经过大规模强化学习训练的强大推理模型,具有复杂的结构和庞大的参数量。DeepSeek-R1 在数学、编程、逻辑推理等任务上表现出色,能够生成高质量的预测结果。
    • Qwen-32B 是学生模型:它是一个参数量较小的模型,通过学习 DeepSeek-R1 的输出来提升自己的推理能力。在蒸馏过程中,DeepSeek-R1 生成的推理轨迹和预测结果被用作“教学材料”,Qwen-32B 通过模仿这些输出来学习。
  • 蒸馏过程

    • 数据生成:DeepSeek-R1 生成了 800K 条高质量的推理数据,这些数据包括数学、编程、逻辑推理等任务。这些数据被用作蒸馏过程中的“教学材料”。
    • 训练过程:Qwen-32B 作为学生模型,输入这些数据并尝试生成与 DeepSeek-R1 相似的推理轨迹和预测结果。通过监督微调(SFT),Qwen-32B 的参数不断优化,使其输出逐渐逼近 DeepSeek-R1。
    • 性能提升:经过蒸馏的 Qwen-32B 在多个基准测试中表现出色,例如在 AIME 2024 上得分 72.6%,在 MATH-500 上得分 94.3%,在 LiveCodeBench 上得分 57.2%。这些结果显著优于直接在 Qwen-32B 上进行强化学习的结果。

通过这种知识蒸馏的方式,DeepSeek-R1 的推理能力被高效地迁移到了 Qwen-32B 中,使得 Qwen-32B 在推理任务上能够达到与 DeepSeek-R1 相当的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/70377.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Idea 2024.3 使用CodeGPT插件整合Deepseek

哈喽&#xff0c;大家好&#xff0c;我是浮云&#xff0c;最近国产大模型Deepseek异常火爆&#xff0c;作为程序员我也试着玩了一下&#xff0c;首先作为简单的使用&#xff0c;大家进入官网&#xff0c;点击开始对话即可进行简单的聊天使用&#xff0c;点击获取手机app即可安装…

SOME/IP报文格式及发现协议详解

在之前的文章中&#xff0c;我们介绍了SOME/IP协议的几种服务接口。在本篇博客中&#xff0c;主要介绍some/ip协议传输的header报文格式以及SOME/IP-SD发现协议。 目录 流程 报文格式 Message ID Length Request ID protocal version/Interface Version Message Type…

【AIGC魔童】DeepSeek核心创新技术(二):MLA

【AIGC魔童】DeepSeek核心创新技术&#xff08;二&#xff09;&#xff1a;MLA 1. MLA框架的定义与背景2. MLA框架的技术原理&#xff08;1&#xff09;低秩联合压缩&#xff08;2&#xff09;查询的低秩压缩&#xff08;3&#xff09;旋转位置嵌入&#xff08;RoPE&#xff09…

idea——IDEA2024版本创建Sping项目无法选择Java 8

目录 一、背景二、解决方式&#xff08;替换创建项目的源地址&#xff09; 一、背景 IDEA2024创建一个springboot的项目&#xff0c;本地安装的是1.8&#xff0c;但是在使用Spring Initializr创建项目时&#xff0c;发现版本只有17、21、23。 二、解决方式&#xff08;替换创…

【自然语言处理】TextRank 算法提取关键词(Python实现)

文章目录 前言PageRank 实现TextRank 简单版源码实现jieba工具包实现TextRank 前言 TextRank 算法是一种基于图的排序算法&#xff0c;主要用于文本处理中的关键词提取和文本摘要。它基于图中节点之间的关系来评估节点的重要性&#xff0c;类似于 Google 的 PageRank 算法。Tex…

Docker Desktop安装到其他盘

Docker Desktop 默认安装到c盘&#xff0c;占用空间太大了&#xff0c;想给安装到其他盘&#xff0c;网上找了半天的都不对 正确安装命令&#xff1a; start /w "" "Docker Desktop Installer.exe" install --installation-dirF:\docker命令执行成功&am…

重新刷题求职2-DAY6-哈希表

1.有效的字母异位词 给定两个字符串 s 和 t &#xff0c;编写一个函数来判断 t 是否是 s 的 字母异位词 示例 1: 输入: s "anagram", t "nagaram" 输出: true示例 2: 输入: s "rat", t "car" 输出: false提示: 1 < s.leng…

feign 远程调用详解

在平常的开发工作中&#xff0c;我们经常需要跟其他系统交互&#xff0c;比如调用用户系统的用户信息接口、调用支付系统的支付接口等。那么&#xff0c;我们应该通过什么方式进行系统之间的交互呢&#xff1f;今天&#xff0c;简单来总结下 feign 的用法。 1&#xff1a;引入依…

学习日记-250207

一.论文 1.Prompt Learning for News Recommendation 任务不一致&#xff08;LLM与实际任务&#xff09;产生prompt提示。 Prompt Learning for News Recommendation 论文阅读 SIGIR2023-CSDN博客 2.GPT4Rec: A Generative Framework for Personalized Recommendation and…

【Apache Paimon】-- 15 -- 利用 paimon-flink-action 同步 postgresql 表数据

利用 Paimon Schema Evolution 核心特性同步变更的 postgresql 表结构和数据 1、背景信息 在Paimon 诞生以前,若 mysql/pg 等数据源的表结构发生变化时,我们有几种处理方式 (1)人工消息通知,然后手动同步到数据仓库中(2)使用 flink 消费 DDL binlog ,然后自动更新 Hi…

Rust语言进阶之标准输入: stdin用法实例(一百零五)

简介&#xff1a; CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布&#xff1a;《Android系统多媒体进阶实战》&#x1f680; 优质专栏&#xff1a; Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a; 多媒体系统工程师系列【…

modbus协议处理

//------------------------0x01-------------------------------- //MDA_usart_send: aa 55 01 00 06 00 02 00 05 //转modbusTCP——Master——send&#xff1a;地址00002&#xff0c;寄存器数量&#xff1a;00005 00 00 00 00 00 06 01 01 00 02 00 05 //ModbusTCP——Slave…

保姆级教程Docker部署KRaft模式的Kafka官方镜像

目录 一、安装Docker及可视化工具 二、单节点部署 1、创建挂载目录 2、运行Kafka容器 3、Compose运行Kafka容器 4、查看Kafka运行状态 三、集群部署 四、部署可视化工具 1、创建挂载目录 2、运行Kafka-ui容器 3、Compose运行Kafka-ui容器 4、查看Kafka-ui运行状态 …

CPU的基本结构

基本结构 控制器&#xff08;Control Unit&#xff09;&#xff1a;负责控制&#xff0c;如指令计数器&#xff0c;指令跳转。 算术逻辑控制器&#xff08;Arithmetic/Logic Unit&#xff09;&#xff1a;负责计算&#xff0c;如算术运算加减&#xff0c;逻辑比较大小等。 南北…

如何使用deepseek开发一个翻译API

什么是deepseek Deepseek 是一个基于人工智能技术的自然语言处理平台&#xff0c;提供了多种语言处理能力&#xff0c;包括文本翻译、语义分析、情感分析等。它通过深度学习模型和大规模语料库训练&#xff0c;能够实现高质量的文本翻译和多语言理解。Deepseek 的核心优势在于…

UnityShader学习笔记——渲染路径

——内容源自唐老狮的shader课程 目录 1.是什么 2.LightMode标签 3.前向渲染路径&#xff08;Forward&#xff09; 3.1.处理光照的方式 3.2.处理各种光源的方式 3.3.在哪里进行光照计算 4.顶点照明渲染路径&#xff08;Vertex&#xff09; 5.延迟渲染路径&#xff08;…

单片机通讯中的时序图:初学者的入门指南

一、什么是时序图&#xff1f; 在单片机的世界里&#xff0c;时序图是一种非常重要的工具&#xff0c;它用于描述信号在时间上的变化规律。简单来说&#xff0c;时序图就像是信号的“时间线”&#xff0c;它展示了各个信号线在不同时间点上的电平状态。通过时序图&#xff0c;我…

docker常用命令及案例

以下是 Docker 的所有常用命令及其案例说明&#xff0c;按功能分类整理&#xff1a; 1. 镜像管理 1.1 拉取镜像 命令: docker pull <镜像名>:<标签>案例: 拉取官方的 nginx 镜像docker pull nginx:latest1.2 列出本地镜像 命令: docker images案例: 查看本地所有…

集合类不安全问题

ArrayList不是线程安全类&#xff0c;在多线程同时写的情况下&#xff0c;会抛出java.util.ConcurrentModificationException异常 解决办法&#xff1a; 1.使用Vector&#xff08;ArrayList所有方法加synchronized&#xff0c;太重&#xff09; 2.使用Collections.synchronized…

【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具04

SQLSERVER的ImpDp和ExpDp工具演示 1、指定某些表作为导出对象外 (-exclude_table) 验证用&#xff1a;导出的表&#xff0c;导入到新的数据库 2、指定某些表作为导出对象外 (-exclude_table) 支持模糊检索&#xff0c;可以使用星号 以s开头的表作为导出对象外&#xff0c;…